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PREFACIO 


Han pasado veinte años desde que se publicó por primera vez este libro. Durante ese tiempo, 
nuestro escepticismo acerca de que los métodos numéricos y las computadoras tendrían un 
papel prominente en el currículo de la ingeniería —particularmente en sus etapas tempranas— 
ha sido rebasado por mucho. Hoy día, muchas universidades ofrecen cursos para estudiantes de 
nuevo ingreso, de segundo año e intermedios, tanto de introducción a la computación como 
de métodos numéricos. Además, muchos de nuestros colegas integran problemas orientados a 
la computación con otros cursos, en todos los niveles del currículo. Así, esta nueva edición aún 
se basa en la premisa fundamental de que debe darse a los estudiantes de ingeniería una intro- 
ducción profunda y temprana a los métodos numéricos. En consecuencia, aunque la nueva 
edición expande sus alcances, tratamos de mantener muchas de las características que hicieron 
accesible la primera edición, para estudiantes principiantes como avanzados: 


» Orientado a problemas. Los estudiantes de ingeniería aprenden mejor cuando están mo- 
tivados por la solución de problemas, lo cual es especialmente cierto en el caso de las ma- 
temáticas y de la computación. Por tal razón, presentamos los métodos numéricos desde la 
perspectiva de la solución de problemas. 

» Pedagogía enfocada en el estudiante. Hemos presentado varios detalles para lograr que 
este texto sea tan accesible para el estudiante como sea posible. Estos detalles comprenden 
la organización general, el uso de introducciones y epílogos para consolidar los temas prin- 
cipales, así como un amplio uso de ejemplos desarrollados y estudios de casos de las áreas 
principales de la ingeniería. Hemos puesto especial cuidado en que nuestras explicaciones 
sean claras y en que tengan una orientación práctica. 

+» Herramientas de computación. Capacitamos a nuestros estudiantes ayudándoles a utilizar 
las herramientas numéricas tipo “apunte y dispare” para resolución de problemas que están 
incluidas en programas como Excel, MATLAB y Mathcad. Sin embargo, también se mues- 
tra a los estudiantes cómo desarrollar programas sencillos y bien estructurados para exten- 
der las capacidades básicas de dichos entornos. Este conocimiento incluye lenguajes de 
programación estándar tales como Visual Basic, Fortran 90 y C/C++. Creemos que el aban- 
dono actual de la programación de computadora representa algo así como una “salida fácil” 
en los planes de estudios de ingeniería. A fin de cuentas, en la medida que los ingenieros 
no se conformen con herramientas limitadas, tendrán que escribir sus códigos. Sólo enton- 
ces se podrán llamar “macros” o “archivos M”. Este libro está diseñado para darles el poder 
de hacer eso. 


Más allá de estos cinco principios originales, la séptima edición tiene conjuntos de problemas 
nuevos y expandidos. La mayoría de los problemas se han modificado de manera que tengan 
soluciones numéricas diferentes de las ediciones anteriores. Además, se han incluido diversos 
problemas nuevos. 

La séptima edición también incluye Connect* de McGraw-Hill. Esta herramienta de ad- 
ministración de tareas en línea permite la asignación de problemas algorítmicos para tareas en 
casa, exámenes y pruebas. Conecta a los estudiantes con las herramientas y los recursos que 
necesitan para lograr el éxito. 

Como siempre, nuestra intención principal al escribir este libro es dar a los estudiantes una 
introducción a los métodos numéricos. Creemos que los estudiantes motivados que disfrutan de 
los métodos numéricos, las computadoras y las matemáticas serán, a final de cuentas, mejores 
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ingenieros. Si nuestro texto fomenta el entusiasmo por estos temas, consideraremos que nuestros 
esfuerzos han tenido buen éxito, 


Agradecimientos. Nos gustaría agradecer a nuestros amigos de McGraw-Hill. Especialmen- 
te, Lorraine Buczek y Bill Stenquist, quienes brindaron una atmósfera positiva de apoyo para 
crear esta edición. Como de costumbre, Beatrice Sussman hizo un trabajo magistral en el cote- 
jo del manuscrito, y Arpana Kumari de Aptara también realizó un trabajo excelente en la fase 
final de producción del libro. Como en ediciones pasadas, David Clough (Universidad de Colo- 
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Se debe subrayar que, aunque recibimos consejos útiles de las personas arriba mencionadas, 
somos responsables de cualquier inexactitud o error que usted pudiera detectar en esta edición, 
Por favor póngase en contacto con Steve Chapra por correo electrónico si detectara cualquier 
error en esta edición. 

Finalmente, nos gustaría dar las gracias a nuestras familias, a nuestros amigos y a nuestros 
estudiantes por su constante paciencia y apoyo. En especial a Cynthia Chapra, Danielle Husley 
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PT1.1 MOTIVACIÓN 


Los métodos numéricos constituyen técnicas mediante las cuales es posible formular problemas 
matemáticos, de tal forma que puedan resolverse utilizando operaciones aritméticas. Aunque existen 
muchos tipos de métodos numéricos, éstos comparten una característica común: invariablemente 
requieren de un buen número de tediosos cálculos aritméticos. No es raro que con el desarrollo 
de computadoras digitales eficientes y rápidas, el papel de los métodos numéricos en la solución de 
problemas en ingeniería haya aumentado de forma considerable en los últimos años. 


PT1.1.1 Métodos no computacionales 


Además de proporcionar un aumento en la potencia de cálculo, la disponibilidad creciente de las 
computadoras (en especial de las personales) y su asociación con los métodos numéricos han influi- 
do de manera muy significativa en el proceso de la solución actual de los problemas en ingeniería. 
Antes de la era de la computadora los ingenieros sólo contaban con tres métodos para la solución de 
problemas: 


1. Las soluciones de algunos problemas fueron obtenidas usando métodos exactos o analíticos. 
Dichas soluciones resultaban útiles y proporcionaban una comprensión excelente del compor- 
tamiento de algunos sistemas. No obstante, las soluciones analíticas sólo pueden encontrarse 
para una clase limitada de problemas. Éstos incluyen aquellos que pueden aproximarse mediante 
modelos lineales y también aquellos que tienen una geometría simple y de baja dimensión. En 
consecuencia, las soluciones analíticas tienen un valor práctico limitado porque la mayoría de 
los problemas reales son no lineales, e implican formas y procesos complejos. 

2. Las soluciones gráficas fueron usadas para caracterizar el comportamiento de los sistemas, usual- 
mente gráficas o monogramas, las cuales tomaban la forma de gráficas o monogramas; aunque 
las técnicas gráficas se utilizan a menudo para resolver problemas complejos, los resultados no 
son muy precisos. Además, las soluciones gráficas (sin la ayuda de una computadora) son en 
extremo tediosas y difíciles de implementar. Finalmente, las técnicas gráficas están limitadas a 
los problemas que puedan describirse usando tres dimensiones o menos. 

3. Para implementar los métodos numéricos manualmente se utilizaban calculadoras y reglas de 
cálculo. Aunque en teoría dichas aproximaciones deberían ser perfectamente adecuadas para 
resolver problemas complicados, en la práctica se presentan varias dificultades debido a que 
los cálculos manuales son lentos y tediosos. Además, los resultados no son consistentes, ya 
que surgen equivocaciones cuando se efectúan los numerosos cálculos de esta manera. 


Antes del uso de la computadora se gastaba bastante energía en la técnica misma de solución, 
en lugar de usarla en la definición del problema y su interpretación (figura PT1.1a). Esta situación 
desafortunada se debía al tiempo y trabajo monótono que se requería para obtener resultados 
numéricos con técnicas que no utilizaban la computadora. 

En la actualidad, las computadoras y los métodos numéricos ofrecen una alternativa para los 
cálculos complicados. Al usar el poder del cómputo se obtienen soluciones directamente, de esta 
manera se pueden aproximar los cálculos sin tener que recurrir a consideraciones de simplificación 
o a técnicas muy lentas. Aunque las soluciones analíticas aún son muy valiosas, tanto para resol- 
ver problemas como para brindar una mayor comprensión, los métodos numéricos representan op- 
ciones que aumentan, en forma considerable, la capacidad para enfrentar y resolver los problemas; 
como resultado, se dispone de más tiempo para aprovechar las habilidades creativas personales. En 
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FORMULACIÓN FORMULACIÓN 
Leyes fundamentales Exposición profunda 
explicadas de la relación del 
brevemente problema con las leyes 
fundamentales 
SOLUCIÓN | 
SOLUCIÓN 
Métodos muy elaborados 
y con frecuencia complicados Método de la 
para hacer manejable computadora fácil 
el problema de usar 
Figura PT1.1 
Las tres fases en la solución de problemas en in- | | 
geniería en a) la era anterior a las computadoras y 
b) la era de las computadoras. Los tamaños de los INTERPRETACIÓN INTERPRETACIÓN 
recuadros indican el nivel de importancia que se 
presenta en cada fase. Las computadoras facilitan Análisis profundo La facilidad de calcular 
la implementación de técnicas de solución y, así, limitado por una permite pensar holísticamente y 
permiten un mayor interés sobre los aspectos crea- solución que desarrollar la intuición; es factible 
tivos en la formulación de problemas y la interpre- di LOS estualania ne Ye 
tacón a leersltados comportamiento del sistema 
a) b) 


consecuencia, es posible dar más importancia a la formulación de un problema y a la interpretación 
de la solución, así como a su incorporación al sistema total, o conciencia “holística” (figura PT1.1b). 


PT1.1.2 Los métodos numéricos y la práctica en ingeniería 


Desde finales de la década de los cuarenta, la amplia disponibilidad de las computadoras digitales 
han llevado a una verdadera explosión en el uso y desarrollo de los métodos numéricos. Al prin- 
cipio, este crecimiento estaba limitado por el costo de acceso a las grandes computadoras (main- 
frames), por lo que muchos ingenieros seguían usando simples procedimientos analíticos en una 
buena parte de su trabajo. Vale la pena mencionar que la reciente evolución de computadoras perso- 
nales de bajo costo ha permitido el acceso, de mucha gente, a las poderosas capacidades de cómpu- 
to. Además, existen diversas razones por las cuales se deben estudiar los métodos numéricos: 


1. Los métodos numéricos son herramientas muy poderosas para la solución de problemas. Son 
capaces de manipular grandes sistemas de ecuaciones, manejar no linealidades y resolver geome- 
trías complicadas, comunes en la práctica de la ingeniería y, a menudo, imposibles de resolver en 
forma analítica. Por lo tanto, aumentan la habilidad de quien los estudia para resolver problemas. 

2. En el transcurso de su carrera, es posible que usted tenga la oportunidad de utilizar paquetes 
disponibles comercialmente, o programas “en caja negra” que contengan métodos numéricos. 
El uso eficiente de estos programas depende del buen entendimiento de la teoría básica en que 
se basan tales métodos. 

3. Hay muchos problemas que no pueden resolverse con programas “en caja negra”. Si usted es 
conocedor de los métodos numéricos y es hábil en la programación de computadoras, entonces 
tiene la capacidad de diseñar sus propios programas para resolver los problemas, sin tener que 
comprar un software costoso. 

4. Los métodos numéricos son un vehículo eficiente para aprender a servirse de las computadoras. Es 
bien sabido que una forma efectiva de aprender programación consiste en escribir programas de 
computadora. Debido a que la mayoría de los métodos numéricos están diseñados para implemen- 
tarlos en las computadoras, son ideales para tal propósito. Además, son especialmente adecuados 
para ilustrar el poder y las limitaciones de las computadoras. Cuando usted desarrolle en forma 


PT1.2 Antecedentes matemáticos 


satisfactoria los métodos numéricos en computadora y los aplique para resolver los problemas que 
de otra forma resultarían inaccesibles, usted dispondrá de una excelente demostración de cómo 
las computadoras sirven para su desarrollo profesional. Al mismo tiempo, aprenderá a reconocer 
y controlar los errores de aproximación que son inseparables de los cálculos numéricos a gran escala. 

5. Los métodos numéricos son un medio para reforzar la comprensión de las matemáticas, ya que 
una de sus funciones es convertir las matemáticas superiores en operaciones aritméticas básicas, 
de esta forma se puede profundizar en los temas que de otro modo resultarían oscuros. Esta 
perspectiva dará como resultado un aumento de su capacidad de comprensión y entendimiento 
en la materia. 


PT1.2 ANTECEDENTES MATEMÁTICOS 


Cada parte de este libro requiere de algunos conocimientos matemáticos, por lo que el material in- 
troductorio de cada parte comprende una sección que incluye los fundamentos matemáticos. Como 
la parte uno, que está dedicada a aspectos básicos sobre las matemáticas y la computación, en esta 
sección no se revisará ningún tema matemático específico. En vez de ello se presentan los temas del 
contenido matemático que se cubren en este libro. Éstos se resumen en la figura PT1.2 y son: 


1. Raíces de ecuaciones (figura PT1.2a). Estos problemas se relacionan con el valor de una variable o 
de un parámetro que satisface una ecuación no lineal. Son especialmente valiosos en proyectos de 
ingeniería, donde con frecuencia es imposible resolver explícitamente las ecuaciones para los 
parámetros definidos. 

2. Sistemas de ecuaciones algebraicas lineales (figura PT1.2b). En esencia, se trata de problemas 
similares a los de raíces de ecuaciones, en el sentido de que están relacionados con valores que 
satisfacen las ecuaciones. Sin embargo, en lugar de satisfacer una sola ecuación, se busca un 
conjunto de valores que satisfaga simultáneamente un conjunto de ecuaciones algebraicas lineales, 
las cuales surgen en el contexto de una gran variedad de problemas y en todas las disciplinas 
de la ingeniería. En particular, se originan a partir de modelos matemáticos de grandes sistemas de 
elementos interrelacionados, tal como estructuras, circuitos eléctricos y redes de flujo; aunque 
también se llegan a encontrar en otras áreas de los métodos numéricos como el ajuste de curvas 
y las ecuaciones diferenciales. 

3. Optimización (figura PT1.2c). En estos problemas se trata de determinar el valor o los valores 
de una variable independiente que corresponden al “mejor” o al valor óptimo de una función. 
De manera que, como se observa en la figura PT1.2c, la optimización considera la identificación 
de máximos y mínimos. Tales problemas se presentan comúnmente en el contexto del diseño en 
ingeniería. También surgen en otros métodos numéricos. Nosotros nos ocuparemos de la optimi- 
zación tanto para una sola variable sin restricciones como para varias variables sin restricciones. 
También describiremos la optimización restringida dando especial énfasis a la programación 
lineal. 

4. Ajuste de curvas (figura PT1.2d). A menudo se tendrá que ajustar curvas a un conjunto de datos 
representados por puntos. Las técnicas desarrolladas para tal propósito se dividen en dos cate- 
gorías generales: regresión e interpolación. La primera se emplea cuando hay un significativo 
grado de error asociado con los datos; con frecuencia los datos experimentales son de este tipo. 
Para estas situaciones, la estrategia es encontrar una curva que represente la tendencia general de 
los datos, sin necesidad de tocar los puntos individuales. En contraste, la interpolación se utiliza 
cuando el objetivo es determinar valores intermedios entre datos que estén, relativamente, libres 
de error. Tal es el caso de la información tabulada. En dichas situaciones, la estrategia consiste 
en ajustar una curva directamente mediante los puntos obtenidos como datos y usar la curva para 
predecir valores intermedios. 

5. Integración (figura PT1.2e). Como hemos representado gráficamente, la interpretación de la 
integración numérica es la determinación del área bajo la curva. La integración tiene diversas 
aplicaciones en la práctica de la ingeniería, que van desde la determinación de los centroides de 
objetos con formas extrañas, hasta el cálculo de cantidades totales basadas en conjuntos de me- 
didas discretas. Además, las fórmulas de integración numérica desempeñan un papel importante 
en la solución de ecuaciones diferenciales. 


6 Parte 1 Modelos, computadoras y análisis del error 


Figura PT1.2 
Resumen de los métodos numéricos que se con- 
sideran en este libro. 


a) Parte 2: Raíces de ecuaciones 
Resuelva f(x) = O para x. 


b) Parte 3: Sistema de ecuaciones 
algebraicas lineales 
Dadas las a y las c, resolver 


41¡X + 419= Cj 
4)1X] + 497X)= Ca 


para las x. 


C) Parte 4: Optimización 
Determine la x que da el óptimo 
de Ax). 


d) Parte 5: Ajuste de curvas 
Fo) 


Regresión 


e) Parte 6: Integración 
1= fa FG) de 


Encuentre el área bajo la curva. 
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6. Ecuaciones diferenciales ordinarias (figura PT1.2f). Éstas tienen una enorme importancia 
en la práctica de la ingeniería, lo cual se debe a que muchas leyes físicas están expresadas en 
términos de la razón de cambio de una cantidad, más que en términos de la cantidad misma. 
Entre los ejemplos tenemos desde los modelos de predicción demográfica (razón de cambio 
de la población), hasta la aceleración de un cuerpo que cae (razón de cambio de la velocidad). 


PT1.3 Orientación 


Se tratan dos tipos de problemas: problemas con valor inicial y problemas con valores en la 
frontera. Además veremos el cálculo de valores propios. 

7. Ecuaciones diferenciales parciales (figura PT1.2g). Las ecuaciones diferenciales parciales son 
usadas para caracterizar sistemas de ingeniería, en los que el comportamiento de una cantidad 
física se expresa en términos de su razón de cambio con respecto a dos o más variables inde- 
pendientes. Entre los ejemplos tenemos la distribución de temperatura en estado estacionario 
sobre una placa caliente (espacio bidimensional) o la temperatura variable con el tiempo de una 
barra caliente (tiempo y una dimensión espacial). Para resolver numéricamente las ecuaciones 
diferenciales parciales se emplean dos métodos bastante diferentes. En el presente texto hare- 
mos énfasis en los métodos de las diferencias finitas que aproximan la solución usando puntos 
discretos (figura PT1.2g). No obstante, también presentaremos una introducción a los métodos 
de elementos finitos, los cuales usan una aproximación con piezas discretas. 


PT1.3 ORIENTACIÓN 


Resulta útil esta orientación antes de proceder a la introducción de los métodos numéricos. Lo que 
sigue está pensado como una vista general del material contenido en la parte uno. Se incluyen, ade- 
más, algunos objetivos como ayuda para concentrar el esfuerzo del lector en el estudio de los temas. 


PT1.3.1 Alcance y presentación preliminar 


La figura PT1.3 es una representación esquemática del material contenido en la parte uno. Este 
diagrama se elaboró para ofrecer un panorama global de esta parte del libro. Se considera que un 
sentido de “imagen global” resulta importante para desarrollar una verdadera comprensión de los 
métodos numéricos. Al leer un texto es posible que se pierda uno en los detalles técnicos. Siempre 
que el lector perciba que está perdiendo la “imagen global” vuelva a la figura PT1.3 para orientarse 
nuevamente. Cada parte de este libro contiene una figura similar. 

La figura PT1.3 también sirve como una breve revisión inicial del material que se cubre en la 
parte uno. El capítulo 1 está diseñado para orientarle en los métodos numéricos y para motivarlo 
mostrándole cómo se utilizan dichas técnicas, en el proceso de elaborar modelos matemáticos apli- 
cados a la ingeniería. El capítulo 2 es una introducción y un repaso de los aspectos de computación 
que están relacionados con los métodos numéricos y presenta las habilidades de programación que 
se deben adquirir para explotar de manera eficiente la siguiente información. Los capítulos 3 y 4 se 
ocupan del importante tema del análisis del error, que debe entenderse bien para el uso efectivo de los 
métodos numéricos. Además, se incluye un epílogo que presenta los elementos de juicio que tienen 
una gran importancia para el uso efectivo de los métodos numéricos. 


PT1.3.2 Metas y objetivos 


Objetivos de estudio Al terminar la parte uno el lector deberá estar preparado para aventurar- 
se en los métodos numéricos. En general, habrá adquirido una comprensión fundamental de la im- 
portancia de las computadoras y del papel que desempeñan las aproximaciones y los errores en el 
uso y desarrollo de los métodos numéricos. Además de estas metas generales, deberá dominar cada 
uno de los objetivos de estudio específicos que se muestran en la tabla PT1.1. 


Objetivos de cómputo Al terminar de estudiar la parte uno, usted deberá tener suficientes 
habilidades en computación para desarrollar su propio software para los métodos numéricos de este 
texto. También será capaz de desarrollar programas de computadora bien estructurados y confiables 
basándose en pseudocódigos, diagramas de flujo u otras formas de algoritmo. Usted deberá desa- 
rrollar la capacidad de documentar sus programas de manera que sean utilizados en forma eficiente 
por otros usuarios. Por último, además de sus propios programas, usted deberá usar paquetes de 
software junto con este libro. Programas como Excel, Mathcad o MATLAB, de The MathWorks, 
Inc., son ejemplos de dicho software. Usted deberá estar familiarizado con ellos, ya que será más 
cómodo utilizarlos para resolver después los problemas numéricos de este texto. 
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Tabla PT1.1 Objetivos específicos de estudio de la parte uno. 


IS 


E 


Reconocer la diferencia entre soluciones analíticas y numéricas. 


Definir diseño modular y top-down. 
Definir las reglas para la programación estructurada. 
Ser capaz de elaborar programas estructurados y modulares en un lenguaje de alto nivel. 


alto nivel. 

Empezar a familiarizarse con cualquier software que usará junto con este texto. 
Reconocer la diferencia entre error de truncamiento y error de redondeo. 
Comprender los conceptos de cifras significativas, exactitud y precisión. 


tender cómo e, y e, sirven para terminar un proceso iterativo. 
redondeo. En particular, conocer la diferencia entre precisión simple y extendida. 


cálculos. En particular, apreciar el problema de la cancelación por sustracción. 

Saber cómo la serie de Taylor y su residuo se emplean para representar funciones continuas. 
Conocer la relación entre diferencias finitas divididas y derivadas. 

Ser capaz de analizar cómo los errores se propagan a través de las relaciones funcionales. 
Estar familiarizado con los conceptos de estabilidad y condición. 

Familiarizarse con las consideraciones que se describen en el epílogo de la parte uno. 
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Entender cómo las leyes de conservación se emplean para desarrollar modelos matemáticos de sistemas físicos. 


Saber cómo se traducen los diagramas de flujo estructurado y el pseudocódigo al código de un lenguaje de 


Conocer la diferencia entre error relativo verdadero e,, error relativo aproximado e, y error aceptable e, y en- 
Entender cómo se representan los números en las computadoras y cómo tal representación induce errores de 


Reconocer cómo la aritmética de la computadora llega a presentar y amplificar el error de redondeo en los 


Programación 


a organización del material en la parte uno: Modelos, computadoras y análisis del error. 
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Modelos matemáticos y solución 
de problemas en ingeniería 


El conocimiento y la comprensión son prerrequisitos para la aplicación eficaz de cualquier herra- 
mienta. Por ejemplo, no importa lo impresionante que sea la caja de herramientas, será muy díficil 
reparar un automóvil si no se entiende cómo funciona. 

Ésta es una realidad, particularmente cuando se utilizan computadoras para resolver problemas 
de ingeniería. Aunque las computadoras tienen una gran utilidad, son prácticamente inútiles si no 
se comprende el funcionamiento de los sistemas de ingeniería. 

Esta comprensión inicialmente es empírica —es decir, se adquiere por observación y experi- 
mentación—. Sin embargo, aunque esta información obtenida de manera empírica resulta esencial, 
sólo estamos a la mitad del camino. Durante muchos años de observación y experimentación, los 
ingenieros y los científicos han advertido que ciertos aspectos de sus estudios empíricos ocurren una 
y otra vez. Este comportamiento general puede expresarse como las leyes fundamentales que en- 
globa, en esencia, el conocimiento acumulado de la experiencia pasada. Así, muchos problemas de 
ingeniería se resuelven con el empleo de un doble enfoque: el empirismo y el análisis teórico (figu- 
ra 1.1). 

Debe destacarse que ambos están estrechamente relacionados. Conforme se obtienen nuevas 
mediciones, las generalizaciones llegan a modificarse o aun a descubrirse otras nuevas. De igual 
manera, las generalizaciones tienen una gran influencia en la experimentación y en las observacio- 
nes. En lo particular, las generalizaciones sirven para organizar principios que se utilizan para sin- 
tetizar los resultados de observaciones y experimentos en un sistema coherente y comprensible, del 
que se pueden obtener conclusiones. Desde la perspectiva de la solución de un problema de ingenie- 
ría, el sistema es aún más útil cuando el problema se expresa por medio de un modelo matemático. 

El primer objetivo de este capítulo consiste en introducir al lector a la modelación matemática 
y su papel en la solución de problemas en ingeniería. Se mostrará también la forma en que los mé- 
todos numéricos figuran en el proceso. 


1.1 UN MODELO MATEMÁTICO SIMPLE 


Un modelo matemático se define, de manera general, como una formulación o una ecuación que 
expresa las características esenciales de un sistema físico o de un proceso en términos matemáticos. 
En general, el modelo se representa mediante una relación funcional de la forma: 


Variable variables E funciones 
dependiente =f independientes” PAras uo de fuerza nn 
donde la variable dependiente es una característica que generalmente refleja el comportamiento o 
estado de un sistema; las variables independientes son, por lo común, dimensiones como tiempo 
y espacio, a través de las cuales se determina el comportamiento del sistema; los parámetros son el 
reflejo de las propiedades o la composición del sistema, y las funciones de fuerza son influencias 
externas que actúan sobre el sistema. 

La expresión matemática real de la ecuación (1.1) va desde una simple relación algebraica hasta 
un enorme y complicado grupo de ecuaciones diferenciales. Por ejemplo, a través de sus observa- 
ciones, Newton formuló su segunda ley del movimiento, la cual establece que la razón de cambio 
del movimiento de un cuerpo, es igual a la fuerza resultante que actúa sobre él. La expresión mate- 
mática, o el modelo, de la segunda ley es la ya conocida ecuación 


F=ma (1.2) 
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Figura 1.1 
Proceso de solución de problemas en ingeniería. 


donde F es la fuerza neta que actúa sobre el objeto (N o kg m/s?), m es 
la masa del objeto (kg) y a es su aceleración (m/s?). 

La segunda ley puede escribirse en el formato de la ecuación (1.1), 
dividiendo, simplemente, ambos lados entre m para obtener 


u—=-—- (1.3) 


donde a es la variable dependiente que refleja el comportamiento del 
sistema, F es la función de fuerza y m es un parámetro que representa 
una propiedad del sistema. Observe que en este caso específico no exis- 
te variable independiente porque aún no se predice cómo varía la acele- 
ración con respecto al tiempo o al espacio. 

La ecuación (1.3) posee varias de las características típicas de los 
modelos matemáticos del mundo físico: 


1. Describe un proceso o sistema natural en términos matemáticos. 

2. Representa una idealización y una simplificación de la realidad. 
Es decir, ignora los detalles insignificantes del proceso natural y se 
concentra en sus manifestaciones esenciales. Por ende, la segunda 
ley de Newton no incluye los efectos de la relatividad, que tienen 
una importancia mínima cuando se aplican a objetos y fuerzas que 
interactúan sobre o alrededor de la superficie de la Tierra, a veloci- 
dades y en escalas visibles a los seres humanos. 


3. Finalmente, conduce a resultados reproducibles y, en consecuencia, llega a emplearse con la 
finalidad de predecir. Por ejemplo, dada la fuerza aplicada sobre un objeto de masa conocida, 
la ecuación (1.3) se emplea para calcular la aceleración. 


Debido a su forma algebraica sencilla, la solución de la ecuación (1.2) se obtiene con facilidad. 


Sin embargo, es posible que otros modelos matemáticos de fenómenos físicos sean mucho más 
complejos puedan ser resueltos con exactitud, o que requieran para su solución de técnicas matemá- 
ticas más sofisticadas que la simple álgebra. Para ilustrar un modelo más complicado de este tipo, 
se utiliza la segunda ley de Newton para determinar la velocidad final de la caída libre de un cuerpo 
que se encuentra cerca de la superficie de la Tierra. El cuerpo en caída libre será el de un paracai- 
dista (figura 1.2). Un modelo para este caso se obtiene expresando la aceleración como la razón de 
cambio de la velocidad con respecto al tiempo (dv/dt), y sustituyendo en la ecuación (1.3). Se tiene 

qee (1.4) 

dt m 
donde v es la velocidad (m/s) y tf es el tiempo (s). Así, la masa multiplicada por la razón de cambio 
de la velocidad es igual a la fuerza neta que actúa sobre el cuerpo. Si la fuerza neta es positiva, el 
cuerpo se acelerará. Si es negativa, el cuerpo se desacelerará. Si la fuerza neta es igual a cero, la 
velocidad del cuerpo permanecerá constante. 

Ahora expresemos la fuerza neta en términos de variables y parámetros mensurables. Para un 
cuerpo que cae a distancias cercanas a la Tierra (figura 1.2), la fuerza neta está compuesta por dos 
fuerzas contrarias: la atracción hacia abajo debida a la gravedad F, y la fuerza hacia arriba debida 
a la resistencia del aire F,: 


1.1 Un modelo matemático simple 


Si a la fuerza hacia abajo se le asigna un signo positivo, la segunda ley de Newton puede ser 
utilizada para expresar la fuerza debida a la gravedad como 


Fp=mg (1.6) 


donde g es la constante gravitacional, o la aceleración debida a la gravedad, que es aproximadamen- 
te igual a 9.81 m/s?. 

La resistencia del aire puede expresarse de varias maneras. Una forma sencilla consiste en su- 
poner que es linealmente proporcional a la velocidad,' y que actúa en dirección hacia arriba tal como 


Fy=-cu (1.7) 


donde c es una constante de proporcionalidad llamada coeficiente de arrastre (o resistencia) (kg/s). 
Así, cuanto mayor sea la velocidad de caída, mayor será la fuerza hacia arriba debida a la resistencia 
del aire. El parámetro c toma en cuenta las propiedades del objeto que cae, como su forma o la as- 
pereza de su superficie, que afectan la resistencia del aire. En este caso, c podría ser función del tipo 
de traje o de la orientación usada por el paracaidista durante la caída libre. 

La fuerza neta es la diferencia entre las fuerzas hacia abajo y las fuerzas hacia arriba. Por lo 
tanto, combinando las ecuaciones (1.4) a (1.7), se obtiene 


dv mg-—cv 


pene (1.8) 
dt m 

o simplificando el lado derecho de la igualdad, 
dv Cc 
PA (1.9) 
dt d m 


La ecuación (1.9) es un modelo que relaciona la aceleración de un cuerpo que cae con las fuerzas 
que actúan sobre él. Se trata de una ecuación diferencial porque está escrita en términos de la razón 
de cambio diferencial (dv/dt) de la variable que nos interesa predecir. Sin embargo, en contraste con 
la solución de la segunda ley de Newton en la ecuación (1.3), la solución exacta de la ecuación (1.9) 
para la velocidad del paracaidista que cae no puede obtenerse mediante simples manipulaciones 
algebraicas. Es necesario emplear técnicas más avanzadas, del cálculo, para obtener una solución 
exacta O analítica. Por ejemplo, si inicialmente el paracaidista está en reposo (vu = O en £= 0), se 
utiliza el cálculo integral para resolver la ecuación (1.9), así 


un=*a- 
C 


gm, (1.10) 


Note que la ecuación (1.10) es un ejemplo de la forma general de la ecuación (1.1), donde v(t) es la va- 
riable dependiente, tes la variable independiente, c y m son parámetros, y g es la función de fuerza. 


EJEMPLO 1.1 Solución analítica del problema del paracaidista que cae 

Planteamiento del problema Un paracaidista con una masa de 68.1 kg salta de un globo aeros- 
tático fijo. Aplique la ecuación (1.10) para calcular la velocidad antes de que se abra el paracaídas. 
Considere que el coeficiente de arrastre es igual a 12.5 kg/s. 


Solución Al sustituir los valores de los parámetros en la ecuación (1.10) se obtiene 


_ 9.81(68.1) 


2 z (1 pa 53.44(1- eS 


v(t) 


!De hecho, la relación es realmente no lineal y podría ser representada mejor por una relación con potencias como Fy =-cv?. 
Al final de este capítulo investigaremos, en un ejercicio, de qué manera influyen estas no linealidades en el modelo. 
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Figura 1.2 
Representación esque- 
mática de las fuerzas 
que actúan sobre un 
paracaidista en des- 
censo. F es la fuerza 
hacia abajo debida a 
la atracción de la gra- 
vedad. F,, es la fuerza 
hacia arriba debida a la 
resistencia del aire. 
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que sirve para calcular la velocidad del paracaidista a diferentes tiem- 


pos, tabulando se tiene el cuadro de la derecha. ES vom 

De acuerdo con el modelo, el paracaidista acelera rápidamente 0 0.00 
(figura 1.3). Se alcanza una velocidad de 44.92 m/s después de 10 s. z e 
Observe también que, después de un tiempo suficientemente grande, 5 35.68 
alcanza una velocidad constante llamada velocidad terminal o veloci- 8 41.14 


dad límite de 53.44 m/s. Esta velocidad es constante porque después 10 44.92 
de un tiempo la fuerza de gravedad estará en equilibrio con la resisten- 
cia del aire. Entonces, la fuerza neta es cero y cesa la aceleración. 


12 47.54 
00 53.44 


A la ecuación (1.10) se le llama solución analítica O 
ooo --- oo exacta ya que satisface con exactitud la ecuación diferencial 
Velocidad terminal poe ] Ze 
original. Por desgracia, hay muchos modelos matemáticos que 
no pueden resolverse con exactitud. En muchos de estos casos, 
la única alternativa consiste en desarrollar una solución nu- 
mérica que se aproxime a la solución exacta. 

Como ya se mencionó, los métodos numéricos son aque- 
llos en los que se reformula el problema matemático para lograr 
resolverlo mediante operaciones aritméticas. Esto puede ilus- 
trarse para el caso de la segunda ley de Newton, observando 
que a la razón de cambio de la velocidad con respecto al tiem- 
po se puede aproximar mediante (figura 1.4): 


dv _ Av _ vít,)-vít,) 
dt At tt 


i+1 i 


(1.11) 


donde Av y A? son diferencias en la velocidad y en el tiempo, 
respectivamente, calculadas sobre intervalos finitos, v(t;) es 
Figura 1.3 la velocidad en el tiempo inicial £,, y v(t;,,) es la velocidad 
Solución analítica al problema del paracaidista que cae según algún tiempo más tarde 1,, , Observe que dv/dt = Av/At es 


se ad el ejemplo 1.1. La a ae a El el tiem- aproximado porque Af es finito. Al recordar los cursos de 
po y tiende asintóticamente a una velocidad terminal. calculo tenemos qué 


dv .. Av 
Ñ dt  A1>0 Af 
(Ult; 41) Ñ La ecuación (1.11) representa el proceso inverso. 
Pendiente 1 en : ; as 
dra 0 A la ecuación (1.11) se le denomina una aproximación en 
dv/dt E diferencia finita dividida de la derivada en el tiempo f;. Al 
e E sustituir en la ecuación (1.9), tenemos 
| 
l 
Ult; ) Ut) C 00% 
Pendiente 1 Lo o—t 8 m i 
a 41 i 
aaa aproximada e 
de a) e 
Wi = a : Esta ecuación se reordena para obtener 
1 br 1 
| 
] e c 
l 4,9 =000)+| 800) [13 (1.12) 
L > 
l; Lia t 
UN Note que el término entre corchetes es el lado derecho de 
la propia ecuación diferencial [ecuación (1.9)]. Es decir, este 
Figura 1.4 término nos da un medio para calcular la razón de cambio o 
Uso de una diferencia finita para aproximar la primera derivada la pendiente de v. Así, la ecuación diferencial se ha transfor- 
de y con respecto a £. mado en una ecuación que puede utilizarse para determinar 


algebraicamente la velocidad en 1;,,, usando la pendiente y los 


1.1 Un modelo matemático simple 


valores anteriores de u y f. Si se da un valor inicial para la velocidad en algún tiempo f;, es posible 
calcular con facilidad la velocidad en un tiempo posterior f;,,. Este nuevo valor de la velocidad en 
t¡, Sirve para calcular la velocidad en 1;,, y así sucesivamente. Es decir, a cualquier tiempo, 


valor ¿ , tamaño 
= valor anterior + pendiente x 
nuevo del paso 


Observe que esta aproximación formalmente se conoce como método de Euler. 


EJEMPLO 1.2 Solución numérica al problema de la caída de un paracaidista 


Planteamiento del problema Realice el mismo cálculo que en el ejemplo 1.1, pero usando la 
ecuación (1.12) para obtener la velocidad. Emplee un tamaño de paso de 2 s para el cálculo. 


Solución Al empezar con los cálculos (+, = 0), la velocidad del paracaidista es igual a cero. Con 
esta información y los valores de los parámetros del ejemplo 1.1, se utiliza la ecuación (1.12) para 
calcular la velocidad en £;,, =2 s: 


v= 0+ 981 - 0) 2 =19.62 m/s 
68.1 


Para el siguiente intervalo (de 1 =2 a 4 s) se repite el cálculo y se obtiene 


v= 19.62+ 9.81- 29.63 | 2 =32.04 m/s 


Se continúa con los cálculos de manera similar para obtener los valores 


US v, M/S de la tabla de la izquierda. 

0 0.00 Los resultados se muestran gráficamente en la figura 1.5, junto con 
2 19.62 la solución exacta. Como se puede ver, el método numérico se aproxi- 
Es 32.04 ma bastante a la solución exacta. Sin embargo, debido a que se emplean 
o . segmentos de rectas para aproximar una función que es una curva 
10 4802 “continua, hay algunas diferencias entre los dos resultados. Una forma 
12 50.01 de reducir estas diferencias consiste en usar un tamaño de paso menor. 
0 53.44 Por ejemplo, si se aplica la ecuación (1.12) con intervalos de 1 s, se 


obtendría un error menor, ya que los segmentos de recta estarían un 

poco más cerca de la verdadera solución. Con los cálculos manuales, 
el esfuerzo asociado al usar incrementos cada vez más pequeños haría poco prácticas tales solucio- 
nes numéricas. No obstante, con la ayuda de una computadora personal es posible efectuar fácilmen- 
te un gran número de cálculos; por lo tanto, se puede modelar con más exactitud la velocidad del 
paracaidista que cae, sin tener que resolver exactamente la ecuación diferencial. 


Como se vio en el ejemplo anterior, obtener un resultado numérico más preciso tiene un costo 
en términos del número de cálculos. Cada división a la mitad del tamaño de paso para lograr mayor 
precisión nos lleva a duplicar el número de cálculos. Como vemos, existe un costo inevitable entre 
la exactitud y la cantidad de operaciones. Esta relación es de gran importancia en los métodos nu- 
méricos y constituyen un tema relevante de este libro. En consecuencia, hemos dedicado el epílogo 
de la parte uno para ofrecer una introducción a dicho tipo de relaciones. 
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Modelos matemáticos y solución de problemas en ingeniería 


1.2 LEYES DE CONSERVACIÓN E INGENIERÍA 


Aparte de la segunda ley de Newton, existen otros principios importantes en ingeniería. Entre los 
más importantes están las leyes de conservación. Aunque éstas son fundamentales en una gran va- 
riedad de complicados y poderosos modelos matemáticos, las leyes de conservación en la ciencia y 
en la ingeniería conceptualmente son fáciles de entender. Todas ellas se pueden reducir a 


Cambio = incremento — decremento 


(1.13) 


Éste es precisamente el formato que empleamos al usar la segunda ley de Newton para desarrollar 
un equilibrio de fuerzas en la caída del paracaidista [ecuación (1.8)]. 

Pese a su sencillez, la ecuación (1.13) representa una de las maneras fundamentales en que las 
leyes de conservación se emplean en ingeniería —esto es, predecir cambios con respecto al tiempo—. 


4 Velocidad terminal 


Solución numérica aproximada 


40 - 
E ¡50 
3 Solución analítica, exacta 
20 
0 
0 4 8 12 
ts 
Figura 1.5 


Comparación de las soluciones numéricas y analíticas para el 
problema del paracaidista que cae. 


Tubería 2 
Flujo de entrada = 80 


Tubería 1 Tubería 4 
Flujo de fp >> Flujo de 
entrada = 100 salida = ? 


y 


Tubería 3 
Flujo de salida = 120 


Figura 1.6 
Equilibrio del flujo de un fluido incompresible en estado esta- 
cionario a través de tuberías. 


Nosotros le daremos a la ecuación (1.13) el nombre especial 
de cálculo de variable-tiempo (o transitorio). 

Además de la predicción de cambios, las leyes de conser- 
vación se aplican también en casos en los que no existe cam- 
bio. Si el cambio es cero, la ecuación (1.3) será 


Cambio = 0 = incremento — decremento 
o bien, 


Incremento = decremento (1.14) 


Así, si no ocurre cambio alguno, el incremento y el decremen- 
to deberán estar en equilibrio. Este caso, al que también se le 
da una denominación especial —cálculo en estado estacio- 
nario—, tiene diversas aplicaciones en ingeniería. Por ejemplo, 
para el flujo de un fluido incompresible en estado estacionario 
a través de tuberías, el flujo de entrada debe estar en equilibrio 
con el flujo de salida, esto es 


Flujo de entrada = flujo de salida 


Para la unión de tuberías de la figura 1.6, esta ecuación de 
equilibrio se utiliza para calcular el flujo de salida de la cuar- 
ta tubería, que debe ser de 60. 

Para la caída del paracaidista, las condiciones del estado 
estacionario deberían corresponder al caso en que la fuerza 
neta fuera igual a cero o [ecuación (1.8) con dv/dt = 0] 


mg =Cu (1.15) 


Así, en el estado estacionario, las fuerzas hacia abajo y hacia 
arriba están equilibradas, y en la ecuación (1.15) puede encon- 
trarse la velocidad terminal 


ia 


C 


v 


Aunque las ecuaciones (1.13) y (1.14) pueden parecer 
triviales, éstas determinan las dos maneras fundamentales en 
que las leyes de la conservación se emplean en ingeniería. 
Como tales, en los capítulos siguientes serán parte importan- 
te de nuestros esfuerzos por mostrar la relación entre los 
métodos numéricos y la ingeniería. Nuestro primer medio para 
establecer tal relación son las aplicaciones a la ingeniería que 
aparecen al final de cada parte del libro. 


1.2 Leyes de conservación e ingeniería 


En la tabla 1.1 se resumen algunos de los modelos sencillos de ingeniería y las leyes de conser- 
vación correspondientes, que constituirán la base de muchas de las aplicaciones a la ingeniería. La 
mayoría de aplicaciones de ingeniería química harán énfasis en el balance de masa para el estudio 
de los reactores. El balance de masa es una consecuencia de la conservación de la masa. Éste espe- 
cifica que, el cambio de masa de un compuesto químico en un reactor, depende de la cantidad de 
masa que entra menos la cantidad de masa que sale. 


Tabla 1.1 Dispositivos y tipos de balances que se usan comúnmente en las cuatro grandes 
áreas de la ingeniería. En cada caso se especifica la ley de conservación en que se 
fundamenta el balance. 


15 


Campo Dispositivo Principio aplicado Expresión matemática 
Ingeniería > hb% Conservación Balance de masa: 

$ 7 —> _—Je 
química Reactores de la masa 


Ingeniería civil 


Ingeniería 
mecánica 


Ingeniería 
eléctrica 


Estructura 
Máquina 
A 
Y Pa 


M—_MW 


MMM 


Circuito 


Conservación del 
momentum 


Conservación del 
momentum 


Conservación 
de la carga 


Conservación 
de la energía 


Entrada A Salida 


En un periodo 
Amasa = entradas - salidas 


Equilibrio de fuerzas: 
+F, 


En cada nodo 
> fuerzas horizontales (F,,) =0 
3 fuerzas verticales (F,) = 0 


Equilibrio de fuerzas: Fuerza hacia arriba 


x=0 


Fuerza hacia abajo 


¿A 
m e = Fuerza hacia abajo - fuerza hacia arriba 
t 
Balance de corriente: 


+1, —>0— -i; 
En cada nodo Ñ 


3 corriente (¿) =0 
+ i, 


OS 
ie, ¿0 ¿ 


R; 


Balance de voltaje: 


Alrededor de cada malla 
> fems — > caída de potencial en los resistores = 0 
MEÉ-3IiR=0 
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TABLA 1.2 Algunos aspectos prácticos que se investigarán en las aplicaciones a la ingeniería 
al final de cada parte del libro. 


1. No lineal contra lineal. Mucho de la ingeniería clásica depende de la linealización que permite soluciones ana- 
líticas. Aunque esto es con frecuencia apropiado, puede lograrse una mejor comprensión cuando se revisan 


los problemas no lineales. 


2. Grandes sistemas contra pequeños. Sin una computadora, no siempre es posible examinar sistemas en que 
intervienen más de tres componentes. Con las computadoras y los métodos numéricos, se pueden examinar 
en forma más realista sistemas multicomponentes. 

3. No ¡deal contra ideal. En ingeniería abundan las leyes idealizadas. A menudo, hay alternativas no idealizadas 
que son más realistas pero que demandan muchos cálculos. La aproximación numérica llega a facilitar la 
aplicación de esas relaciones no ideales. 

4. Análisis de sensibilidad. Debido a que están involucrados, muchos cálculos manuales requieren una gran 
cantidad de tiempo y esfuerzo para su correcta realización. Esto algunas veces desalienta al analista cuando 
realiza los múltiples cálculos que son necesarios al examinar cómo responde un sistema en diferentes con- 
diciones. Tal análisis de sensibilidad se facilita cuando los métodos numéricos permiten que la computadora 


asuma la carga de cálculo. 


5. Diseño. Determinar el comportamiento de un sistema en función de sus parámetros es a menudo una propo- 
sición sencilla. Por lo común, es más difícil resolver el problema inverso; es decir, determinar los parámetros 
cuando se especifica el comportamiento requerido. Entonces, los métodos numéricos y las computadoras 
permiten realizar esta tarea de manera eficiente. 


Las aplicaciones en ingeniería civil y mecánica se enfocan al desarrollo de modelos a partir de 


la conservación del momentum. En la ingeniería civil se utilizan fuerzas en equilibrio para el análi- 
sis de estructuras como las armaduras sencillas de la tabla 1.1. El mismo principio se aplica en in- 
geniería mecánica, con la finalidad de analizar el movimiento transitorio hacia arriba o hacia abajo, 
O las vibraciones de un automóvil. 

Por último, las aplicaciones en ingeniería eléctrica emplean tanto balances de corriente como 
de energía para modelar circuitos eléctricos. El balance de corriente, que resulta de la conservación de 
carga, es similar al balance del flujo representado en la figura 1.6. Así como el flujo debe equilibrar- 
se en las uniones de tuberías, la corriente eléctrica debe estar balanceada o en equilibrio en las 
uniones de alambres eléctricos. El balance de energía especifica que la suma algebraica de los cam- 
bios de voltaje alrededor de cualquier malla de un circuito debe ser igual a cero. Las aplicaciones en 
ingeniería se proponen para ilustrar cómo se emplean actualmente los métodos numéricos en la solución 
de problemas en ingeniería. Estas aplicaciones nos permitirán examinar la solución a los problemas 
prácticos (tabla 1.2) que surgen en el mundo real. Establecer la relación entre las técnicas matemá- 
ticas como los métodos numéricos y la práctica de la ingeniería es un paso decisivo para mostrar su 
verdadero potencial. Examinar de manera cuidadosa las aplicaciones a la ingeniería nos ayudará a 


establecer esta relación. 


PROBLEMAS 


1.1 Utilice el cálculo para resolver la ecuación (1.9) para el caso en 
que la velocidad inicial, v(0) es diferente de cero. 

1.2 Repita el ejemplo 1.2. Calcule la velocidad en £ = 8 s, con un 
tamaño de paso de a) 1 y b) 0.5 s. ¿Puede establecer algún enuncia- 
do en relación con los errores de cálculo con base en los resultados? 
1.3 En vez de la relación lineal de la ecuación (1.7), elija modelar la 
fuerza hacia arriba sobre el paracaidista como una relación de segun- 
do orden, 


donde c' = un coeficiente de arrastre de segundo orden (kg/m). 

a) Con el empleo del cálculo, obtenga la solución de forma cerrada 
para el caso en que al inicio el saltador se encuentra en reposo 
(vu=0en 1=0). 


b) Repita el cálculo numérico en el ejemplo 1.2 con los mismos 
valores de condición inicial y de parámetros, pero con un arrastre 
de segundo orden. Utilice un valor de 0.22 kg/m para c”. 
1.4 Para el paracaidista en caída libre con arrastre lineal, suponga 
un primer saltador de 70 kg con coeficiente de arrastre de 12 kg/s. Si 
un segundo saltador tiene un coeficiente de arrastre de 15 kg/s y una 
masa de 80 kg, ¿cuánto tiempo le tomará alcanzar la misma velocidad 
que el primero adquiera en 9 s? 
1.5 Calcule la velocidad de un paracaidista en caída libre con el 
empleo del método de Euler para el caso en que m=80 kg y c=10 
kg/s. Lleve a cabo el cálculo desde £ = O hasta £ =20 s con un tama- 
ño de paso de 1 s. Use una condición inicial en que el paracaidista 
tiene una velocidad hacia arriba de 20 m/s en £ = 0. Suponga que 
el paracaídas se abre instantáneamente en £ = 10 s, de modo que el 
coeficiente de arrastre sube a 60 kg/s. 


1.6 La siguiente información está disponible para una cuenta ban- 
caria: 


Fecha Depósitos Retiros Interés Saldo 
5/ 1522.33 
220.13 327.26 
6/ 
216.80 378.51 
1/ 
450.35 106.80 
8/ 
127.31 350.61 
9/ 


Observe que el dinero gana interés que se calcula como 
Interés = ¿B; 


donde ¡ = tasa de interés expresada como fracción mensual, y B;, es 
el saldo inicial al principio del mes. 

a) Use la conservación de efectivo para calcular el saldo en las 
fechas 6/1, 7/1, 8/1 y 9/1 si la tasa de interés es 1% mensual 
(1 = 0.01/mes). Muestre cada paso del cálculo. 

b) Escriba una ecuación diferencial para el saldo de efectivo en la 
forma: 
dB . 
> = FDO), W(), 1) 

dt 

donde £ = tiempo (meses), D(1) = depósitos como función del 
tiempo ($/mes), W(1) = retiros como función del tiempo ($/ 
mes). Para este caso, suponga que el interés es continuamente 
compuesto; es decir, interés = ¡B. 

c) Use el método de Euler con un paso de tiempo de 0.5 meses para 
simular el saldo. Suponga que los depósitos y retiros se aplican 
uniformemente a lo largo de todo el mes. 

d) Desarrolle una gráfica de saldo contra tiempo para a) y c). 

1.7 La cantidad de un contaminante radiactivo distribuido uniforme- 
mente que se encuentra contenido en un reactor cerrado, se mide por 
su concentración c (becquerel/litro, o Bq/L). El contaminante dismi- 
nuye con una tasa de decaimiento proporcional a su concentración, 
es decir: 


tasa de decaimiento = —kc 


donde k es una constante con unidades de día”!. Entonces, de acuer- 
do con la ecuación (1.13), puede escribirse un balance de masa para 
el reactor, así: 


d 
Es = = ke 
dt 
cambio Y _ [ disminución 
de la masa] | por decaimiento 


a) Use el método de Euler para resolver esta ecuación desde t= 0 
hasta 1 d, con k= 0.175 d*. Emplee un tamaño de paso de Af = 
0.1. La concentración en t=0 es de 100 Bq/L. 
b) Muestre la solución en un gráfico semilogarítmico (p. ej., ln c 
versus t) y determine la pendiente. Interprete sus resultados. 
1.8 Un grupo de 35 estudiantes asiste a clase en un salón que mide 
11 m por 8 m por 3 m. Cada estudiante ocupa alrededor de 0.075 m* 
y genera cerca de 80 W de calor (1 W= 1 J/s). Calcule el incremen- 
to de la temperatura del aire durante los primeros 20 minutos de 
la clase, si el salón está sellado y aislado por completo. Suponga que la 
capacidad calorífica del aire, C,,, es de 0.718 kJ/(kg K). Suponga que 
el aire es un gas ideal a 20 *C y 101.325 kPa. Obsérvese que el calor 
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absorbido por el aire O está relacionado con la masa de aire m, la 
capacidad calorífica, y el cambio en la temperatura, por medio de 
la relación siguiente: 


4 
0= m) CdT=mC(T,-T) 
T 
La masa del aire se obtiene de la ley del gas ideal: 


pv=%_ rr 
Mwt 


donde P es la presión del gas, V es el volumen de éste, Mwt es el 
peso molecular del gas (para el aire, 28.97 kg/kmol) y R es la cons- 
tante universal de los gases ideales [8.314 kPa m*/(kmol K)]. 

1.9 Un tanque de almacenamiento contiene un líquido con profun- 
didad y, donde y = O cuando el tanque está lleno a la mitad. El líqui- 
do se extrae con una tasa de flujo constante O a fin de satisfacer las 
demandas. Se suministra el contenido a una tasa senoidal de 30 
sen?(1). 


y 
0 a E 
AAA 
Figura P1.9 


Para este sistema, la ecuación (1.13) puede escribirse como 


d(Ay 
eAy) =  30Osen(f) - 10) 
dí 
bi 
le al = (flujo de entrada) — (flujo de salida) 


o bien, como el área de la superficie A es constante 

dy 32 Q 

de CA 
Emplee el método de Euler para resolver cuál sería la profundidad y, 
desde £ = 0 hasta 10 d, con un tamaño de paso de 0.5 d. Los valores 
de los parámetros son A = 1250 m? y O = 450 m*/d. Suponga que la 
condición inicial es y = 0. 
1.10 Para el mismo tanque de almacenamiento que se describe en el 
problema 1.9, suponga que el flujo de salida no es constante sino que 
la tasa depende de la profundidad. Para este caso, la ecuación dife- 
rencial para la profundidad puede escribirse como 


a(1+yy* 
A 


sen*(1) 


dy =3 Q sen?(1) 
dt A 

Use el método de Euler para resolver cuál sería la profundidad y, 
desde £=0 hasta 10 d, con un tamaño de paso de 0.5 d. Los valores de 
los parámetros son A = 1250 m?, O = 450 m%/d, y a = 150. Suponga 
que la condición inicial es y = 0. 

1.11 Aplique la conservación de volumen (vea el problema 1.9) para 
simular el nivel de líquido en un tanque cónico de almacenamiento 
(figura P1.11). El líquido entra con un tasa senoidal de O... =3 sen?(1), 
y sale de acuerdo con 
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Osa = 30 => Ys) 
Osa =0 y 


donde el caudal tiene unidades de m?/d y y = elevación de la super- 
ficie de agua sobre el fondo del tanque (m). Use el método de Euler 
para determinar la profundidad y desde £ = 0 hasta 10 d, con un ta- 
maño de paso de 0.5 d. Los valores de los parámetros son: Tp = 2.5 
M, Ysup = 4 M, Y Ysa = 1 m. Suponga que el nivel está inicialmente 
debajo del tubo de salida con y(0) = 0.8 m. 


Y > Ysal 


IAN 


Ysal 


Figura P1.11 


1.12 En el ejemplo del paracaidista en caída libre, se supuso que la 
aceleración debida a la gravedad era un valor constante. Aunque ésta 
es una buena aproximación cuando se estudian objetos en caída cer- 
ca de la superficie de la Tierra, la fuerza gravitacional disminuye 
cuando nos movemos arriba del nivel del mar. Una representación 
más general basada en la ley de Newton del inverso del cuadrado de 
la atracción gravitacional, se escribe como 
2 


R 
8(x) = 8(0) Ri 
donde g(x) = aceleración gravitacional a una altitud x (en m) medida 
hacia arriba a partir de la superficie terrestre (m/s?), g(0) = aceleración 
gravitacional en la superficie terrestre (= 9.81 m/s?) y R = el radio 

de la Tierra (= 6.37 x 10% m). 

a) En forma similar en que se obtuvo la ecuación (1.9), use un 
balance de fuerzas para obtener una ecuación diferencial para 
la velocidad como función del tiempo que utilice esta represen- 
tación más completa de la gravitación. Sin embargo, para esta 
obtención, suponga como positiva la velocidad hacia arriba. 

b) Para el caso en que el arrastre es despreciable, utilice la regla de 
la cadena para expresar la ecuación diferencial como función de la 
altitud en lugar del tiempo. Recuerde que la regla de la cadena es 


de dde 
dt dx dt 


c) Use el cálculo para obtener la forma cerrada de la solución donde 
v=vyenx=0. 

d) Emplee el método de Euler para obtener la solución numérica 
desde x= 0 hasta 100000 m, con el uso de un paso de 10000 m, 
donde la velocidad inicial es de 1500 m/s hacia arriba. Compare 
su resultado con la solución analítica. 

1.13 Suponga que una gota esférica de líquido se evapora a una tasa 
proporcional al área de su superficie. 


dv 


— =-—kA 
dt 
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donde V = volumen (mm?), £ = tiempo (min), k= la tasa de evapora- 
ción (mm/min), y A = área superficial (mm?). Emplee el método de 
Euler para calcular el volumen de la gota desde £ = O hasta 10 min 
usando un tamaño de paso de 0.25 min. Suponga que k = 0.08 mm/ 
min, y que al inicio la gota tiene un radio de 2.5 mm. Evalúe la vali- 
dez de sus resultados por medio de determinar el radio de su volumen 
final calculado y la verificación de que es consistente con la tasa de 
evaporación. 

1.14 La ley del enfriamiento de Newton establece que la temperatu- 
ra de un cuerpo cambia con una tasa que es proporcional a la dife- 
rencia de su temperatura y la del medio que lo rodea (temperatura 
ambiente). 


dT 

> KT —T,) 
donde T = temperatura del cuerpo (*C), f£ = tiempo (min), 
k= constante de proporcionalidad (por minuto) y T,, = tempera- 
tura del ambiente (*C). Suponga que una tasa de café tiene ori- 
ginalmente una temperatura de 70 “C. Emplee el método de Euler 
para calcular la temperatura desde £= 0 hasta 10 min, usando un 
tamaño de paso de 2 min, si 7, = 20 *C y k=0.019/min. 
1.15 Como se ilustra en la figura P1.15, un circuito RLC consiste en 
tres elementos: un resistor (R), un inductor (L) y un capacitor (C). El 
flujo de corriente a través de cada elemento induce una caída de 
voltaje. La segunda ley del voltaje de Kirchhoff dice que la suma 
algebraica de estas caídas de voltaje alrededor de un circuito cerrado 
es Cero, 

¡R+ pe +2=0 

d C 

donde ¡= corriente, R = resistencia, L = inductancia, t = tiempo, q = 
carga y C = capacitancia. Además, la corriente se relaciona con la 
carga como en 


dq 
dt 


=1 


a) Silos valores iniciales son i(0)=0 y q(0) = 1C, use el método de 
Euler para resolver este par de ecuaciones diferenciales desde £ 
=0 hasta 0.1 s, usando un tamaño de paso de Af=0.01 s. Utilice 
los siguientes parámetros para su cálculo: R = 200 (2, L=5H 
y C=10%*E 

b) Desarrolle una gráfica de i y q contra f. 


Resistor Inductor Capacitor 
di q 
iR E dt E 


Figura P1.15 


1.16 Las células cancerosas crecen en forma exponencial con un 
tiempo de duplicación de 20 h cuando tienen una fuente ilimitada de 
nutrientes. Sin embargo, conforme las células comienzan a formar 
un tumor de forma esférica sin abasto de sangre, el crecimiento en el 
centro del tumor queda limitado, y eventualmente las células empie- 
zan a morir. 


a) El crecimiento exponencial del número de células N puede 
expresarse como se indica, donde es la tasa de crecimiento de 
las células. Encuentre el valor de y para las células cancerosas. 


AN 
dt 

b) Construya una ecuación que describa la tasa de cambio del 
volumen del tumor durante el crecimiento exponencial, dado 
que el diámetro de una célula individual es de 20 micras. 

c) Una vez que un tipo particular de tumor excede las 500 micras 
de diámetro, las células del centro del tumor se mueren (pero 
continúan ocupando espacio en el tumor). Determine cuánto 
tiempo tomará que el tumor exceda ese tamaño crítico. 

1.17 Se bombea un fluido por la red que se ilustra en la figura P1.17. 
Si Q0,=0.6, 03 =0.4, O, =0.2 y Oz = 0.3 m/s, determine los otros 
flujos. 


Figura P1.17 


1.18 La velocidad es igual a la razón de cambio de la distancia x (m), 


dx 
—_=vlt 
O 


(P1.18) 
a) Sustituya la ecuación (1.10) y desarrolle una solución analítica 
para distancia como función del tiempo. Suponga que x(0) = 0. 

b) Use el método de Euler para integrar numéricamente las ecuacio- 
nes (P1.18) y (1.9) con objeto de determinar tanto la velocidad 
como la distancia de caída como función del tiempo para los 
primeros 10 s de caída libre usando los mismos parámetros que 
en el ejemplo 1.2. 

c) Trace una gráfica de sus resultados numéricos junto con las 
soluciones analíticas. 

1.19 Usted está trabajando como investigador de escena de crimen, 
y debe predecir la temperatura de una víctima de homicidio en un 
periodo de 5 horas. Usted sabe que el cuarto donde se encontró la 
víctima estaba a 10 *C cuando se descubrió el cadáver. 

a) Usela ley del enfriamiento de Newton (problema 1.14) y el méto- 
do de Euler para calcular la temperatura del cuerpo de la víctima 
para el periodo de 5 horas, usando valores de k = 0.12/h y At= 
0.5 h. Suponga que la temperatura del cuerpo de la víctima en 
el momento de la muerte era de 37 *C y que la temperatura del 
cuarto estaba a un valor constante de 10 *C durante el periodo 
de 5 horas. 

b) Lainvestigación posterior revela que la temperatura del cuarto 
en realidad había caído linealmente de 20 a 10 *C durante el 
periodo de 5 horas. Repita el mismo cálculo que en el inciso 
a), pero incluya esta nueva información. 

c) Compare los resultados del inciso a) y del inciso b) graficándolos 
en la misma gráfica. 
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1.20 Suponga que un paracaidista con arrastre lineal (m = 70 kg, 
c = 12.5 kg/s) salta de un avión que vuela a una altitud de un kiló- 
metro con una velocidad horizontal de 180 m/s relativa a la tierra. 

a) Escriba un sistema de cuatro ecuaciones diferenciales para x, y, 
v, = dx/dt y v, = dy/dt. 

b) Sila posición horizontal inicial se define como x=0, use métodos 
de Euler con Af= 1 s para calcular la posición del paracaidista 
en los primeros 10 s. 

c) Desarrolle gráficas de y contra £ y y contra x. Use la gráfica para 
estimar gráficamente cuándo y dónde chocaría con la tierra el 
paracaidista si el paracaídas no se abriera. 

1.21 Como se observa en el problema 1.3, la fuerza de arrastre se 
representa con más exactitud como dependiente del cuadrado de la 
velocidad. Una representación más fundamental de la fuerza de 
arrastre, que supone condiciones turbulentas (es decir, un alto núme- 
ro de Reynolds) se puede formular como 


donde F,¿= la fuerza de arrastre (N), p = densidad del fluido (kg/m?), 
A =el área frontal del objeto en un plano perpendicular a la dirección 
del movimiento (m2), v= velocidad (m/s) y C, = coeficiente adimen- 
sional de arrastre. 

a) Escriba el par de ecuaciones diferenciales para la velocidad y 
la posición (vea el problema 1.18) para describir el movimiento 
vertical de una esfera con diámetro d (m) y una densidad de 
p, (kg/m*). La ecuación diferencial para la velocidad se debe 
escribir como función del diámetro de la esfera. 

b) Use el método de Euler con un tamaño de paso Af = 2 s para 
calcular la posición y la velocidad de una esfera durante los 
primeros 14 s. Utilice Los siguientes parámetros en su cálculo: d 
= 120 cm, p=1.3 kg/m?, p,=2700 kg/m' y C,¿=0.47. Suponga 
que la esfera tiene las siguientes condiciones iniciales: x(0) = 
100 m y v(0) = 40 m/s. 

c) Desarrolle una gráfica de sus resultados (es decir, y y v contra 
t) y úsela para estimar gráficamente cuándo chocará la esfera 
con el suelo. 

d) Calcule el valor del coeficiente general de arrastre de segundo 
orden c,, (kg/m). Observe que, como se describe en el problema 
1.3, el coeficiente general de arrastre de segundo orden es el tér- 
mino de velocidad en la ecuación diferencial final que multiplica 
el término vlvl. 

1.22 Como se ilustra en la figura P1.22, una partícula esférica que 
se sedimenta a través de un fluido quiescente está sujeta a tres fuerzas: 
la fuerza descendente de la gravedad (F¿), la fuerza ascendente de la 
flotación (F y) y la fuerza de arrastre (F',). Tanto la fuerza de gravedad 
como la de flotación se pueden calcular con la segunda ley de Newton, 
con la segunda igual al peso del fluido desplazado. Para flujo laminar, 
la fuerza de arrastre se puede calcular con la ley de Stokes, 


pAC uy] 


F, = 3nudv 


donde u = viscosidad dinámica del fluido (N s/m?), d = diámetro de 
la partícula (m) y v = velocidad de asentamiento de la partícula (m/s). 
Observe que la masa de la partícula se puede expresar como el produc- 
to del volumen de la partícula y su densidad p, (kg/m), y la masa del 
fluido desplazado se puede calcular como el producto del volumen 
de la partícula y la densidad del fluido p (kg/m*). El volumen de una 
esfera es 7d*/6. Además, el flujo laminar corresponde al caso en el 
que el número adimensional de Reynolds, Re, es menor de 1, donde 
Re = pdu/u. 
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a) Use un balance de fuerzas para la partícula a fin de desarrollar 
la ecuación diferencial para du/dt como función de d, P, P, y Mt. 

b) En estado estable, use la ecuación para despejar la velocidad 
terminal de la partícula. 

c) Utilice el resultado de b) para calcular la velocidad terminal de 
la partícula en m/s para una partícula esférica de limo que se 
sedimenta en agua: d=10 um, p=1 g/cm*, p,=2.65 g/cm y y 
=0.014 g (cm - s). 

d) Verifique si el flujo es laminar. 

e) Use el método de Euler para calcular la velocidad desde £ = 0 
hasta 2715 s, con At = 2718 s, dados los parámetros anteriores 
junto con la condición inicial: v(0) = 0. 
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Figura P1.22 


1.23 Como se describe en el problema 1.22, además de la fuerza 
descendente de la gravedad (peso) y del arrastre, el objeto que cae a 
través de un fluido también está sujeto a la fuerza de flotación, que 
es proporcional al volumen desplazado. Por ejemplo, para una esfe- 
ra con diámetro d(m), el volumen de la esfera es V= 2id*/6, y su área 
proyectada es A = 7id?/4. La fuerza de flotación se puede calcular 
como F, = —PV,. En nuestra obtención de la ecuación (1.9), hemos 
despreciado la flotación porque es relativamente pequeña para un 
objeto como un paracaidista que se mueve en el aire. Sin embargo, 
para un fluido más denso como el agua, se vuelve más importante. 

a) Obtenga una ecuación diferencial del mismo modo que la 
ecuación (1.9), pero incluya la fuerza de flotación y represente 
la fuerza de arrastre como se describe en el problema 1.21. 

b) Reescriba la ecuación diferencial de a) para el caso especial de 
una esfera. 

c) Use la ecuación desarrollada en b) para calcular la velocidad 
terminal (es decir, para el caso de estado estable). Use los si- 
guientes valores de parámetros para la esfera que cae a través 
de agua: diámetro de la esfera = 1 cm; densidad de la esfera = 
2700 kg/m!; densidad del agua = 1000 kg/m? y C¿= 0.47. 

d) Use el método de Euler con un tamaño de paso At = 0.03125 
s para despejar numéricamente la velocidad desde 1 = O hasta 
0.25 s, con velocidad inicial cero. 

1.24 Como se ilustra en la figura P1.24, la deflexión hacia abajo y 
(m) de una viga en voladizo con una carga uniforme w (kg/m) se 
puede calcular como 


w 


2 (AL +61x”) 


y 


donde x = distancia (m), E = módulo de elasticidad = 2 x 10" Pa, 
] = momento de inercia = 3.25 x 10m*, w= 10000 N/m, y L = 
longitud = 4 m. Esta ecuación se puede diferenciar para obtener la 
pendiente de la deflexión hacia abajo como función de x: 


dy w 


= ——(4 -121x*+1212x) 
dx 24El 
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Si y =0 en x = 0, use esta ecuación con el método de Euler (Ax = 
0.125 m) para calcular la deflexión desde x = O hasta L. Desarrolle 
una gráfica de sus resultados junto con la solución analítica calculada 
con la primera ecuación. 


x=0 x=L 
0 > 
w 
y 
Figura P1.24 


Viga en voladizo 


1.25 Use el principio de Arquímedes y desarrolle un balance de 
fuerzas de estado estable para una bola esférica de hielo que flota en 
agua de mar (figura P1.25). El balance de fuerzas se debe expresar 
como polinomio de tercer grado (cúbico) en términos de la altura del 
casquete sobre el nivel del agua (»), la densidad del agua de mar (pp, 
la densidad de la bola (p,) y el radio de la bola (r). 


1] 


Figura P1.25 


1.26 Además de su aplicación en fluidos, el principio de Arquímedes 
ha resultado útil en la geología, cuando se aplica a los sólidos en la 
corteza terrestre. La figura P1.26 ilustra un caso así, en donde una 
montaña cónica más ligera de granito “flota” sobre una capa más 
densa de basalto en la superficie de la tierra. Observe que la parte del 
cono que está debajo de la superficie se denomina frecuentemente 
frústum. Desarrolle un balance de fuerzas de estado de equilibrio para 
este caso en términos de los siguientes parámetros: densidad del 
basalto (p,), densidad del granito (py), el radio de la base del cono 
(r) y la altura por encima de la superficie de la tierra, (A,), y por 
debajo de dicha superficie (h,). 


Basalto 


Figura P1.26 


Programación y software 


En el capítulo 1, desarrollamos un modelo matemático a partir de la fuerza neta para predecir la 
velocidad de caída de un paracaidista. Este modelo tenía la forma de una ecuación diferencial, 
du c 
dt id m 0 
También vimos que se obtenía una solución de esta ecuación utilizando un método numérico simple, 
llamado método de Euler, 
Vi =0,+ A 
dt 
Dada una condición inicial, se emplea esta ecuación repetidamente para calcular la velocidad 
como una función del tiempo. Sin embargo, para obtener una buena precisión sería necesario desa- 
rrollar muchos pasos pequeños. Hacerlo a mano sería muy laborioso y tomaría mucho tiempo; pero, 
con la ayuda de las computadoras, tales cálculos pueden realizarse fácilmente. 
Por ende, nuestro siguiente objetivo consiste en descifrar cómo se hace esto. En el presente ca- 
pítulo daremos una introducción al uso de la computadora como una herramienta para obtener so- 
luciones de este tipo. 


2.1 PAQUETES Y PROGRAMACIÓN 


En la actualidad existen dos tipos de usuarios de software. Por un lado están aquellos que toman lo 
que se les da. Es decir, quienes se limitan a las capacidades que encuentran en el modo estándar de 
operación del software existente. Por ejemplo, resulta muy sencillo resolver un sistema de ecuaciones 
lineales o generar una gráfica con valores x-y con Excel o con MATLAB. Como este modo de ope- 
ración por lo común requiere un mínimo esfuerzo, muchos de los usuarios adoptan este modo de 
operación. Además, como los diseñadores de estos paquetes se anticipan a la mayoría de las necesi- 
dades típicas de los usuarios, muchos de los problemas pueden resolverse de esta manera. 

Pero, ¿qué pasa cuando se presentan problemas que están más allá de las capacidades estándar 
de dichas herramientas? Por desgracia, decir “lo siento, jefe, pero no lo sé hacer” no es algo acepta- 
do en la mayoría de los círculos de la ingeniería. En tales casos usted tiene dos alternativas. 

La primera sería buscar otro paquete y ver si sirve para resolver el problema. Ésta es una de las 
razones por las que quisimos usar tanto Excel como MATLAB en este libro. Como veremos, ninguno 
de los dos abarca todo y cada uno tiene sus ventajas. Sabiendo usar ambos, se amplía de forma no- 
table el rango de problemas que pueden resolverse. 

La segunda sería volverse un “potente usuario” si se aprende a escribir macros en Excel VBA! o 
archivos M (M-files) en MATLAB. ¿Y qué son éstos? No son más que programas computacionales 
que permiten ampliar la capacidad de estas herramientas. Como los ingenieros nunca se sentirán sa- 
tisfechos al verse limitados por las herramientas, harán todo lo que sea necesario para resolver sus 
problemas. Una buena manera de lograrlo consiste en aprender a escribir programas en los ambien- 
tes de Excel y MATLAB. Además, las habilidades necesarias para crear macros o archivos M (M-files) 
son las mismas que se necesitan para desarrollar efectivamente programas en lenguajes como Fortran 
900C. 

El objetivo principal del capítulo es enseñarle cómo se hace esto. Sin embargo, supondremos 
que usted ya ha tenido contacto con los aspectos básicos de la programación y, por tal razón, desta- 


VBA son las siglas de Visual Basic for Applications. 
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caremos las facetas de la programación que afectan directamente su uso en la solución de problemas 
en ingeniería. 


2.1.1 Programas computacionales 


Los programas computacionales son únicamente conjuntos de instrucciones que dirigen a la compu- 
tadora para realizar una cierta tarea. Dado que muchas personas escriben programas para una amplia 
gama de aplicaciones, la mayor parte de los lenguajes de alto nivel, como Fortran 90 o C, tienen 
amplias capacidades. Aunque habrá algunos ingenieros que usarán toda la amplia gama de capaci- 
dades, la mayoría sólo necesitará realizar los cálculos numéricos orientados a la ingeniería. 

Visto desde esta perspectiva, podemos acotar la complejidad a unos cuantos tópicos de progra- 
mación, que son: 


» Representación de información sencilla (declaración de constantes, variables y tipos). 

+ Representación de información más compleja (estructuras de datos, arreglos y registros). 
+ Fórmulas matemáticas (asignación, reglas de prioridad y funciones intrínsecas). 

+ Entrada/Salida. 

» Representación lógica (secuencia, selección y repetición). 

+ Programación modular (funciones y subrutinas). 


Como suponemos que el lector ya ha tenido algún contacto con la programación, no dedicaremos 
mucho tiempo en las cuatro primeras áreas. A lo sumo, los ofrecemos como una lista de verificación 
que cubre lo que necesita saber para implementar los programas que siguen. 

No obstante, sí dedicaremos algún tiempo a los dos últimos tópicos. Destacamos la representación 
lógica porque es el área que más influye en la coherencia y la comprensión de un algoritmo. Incluimos 
la programación modular porque también contribuye ampliamente a la organización del programa. 
Además, los módulos proveen de medios para archivar algoritmos útiles en un formato conveniente 
para aplicaciones subsecuentes. 


2.2 PROGRAMACIÓN ESTRUCTURADA 


En los comienzos de la computación, los programadores no daban mucha importancia a que sus 
programas fueran claros y fáciles de entender. Sin embargo, hoy se reconoce que escribir programas 
organizados y bien estructurados tiene muchas ventajas. Además de las ventajas obvias de tener un 
software más accesible para compartirlo, también ayuda a generar programas mucho más eficientes. 
Es decir, algoritmos bien estructurados, que son invariablemente mucho más fáciles de depurar y de 
probar, lo que resulta en programas que toman menos tiempo desarrollar, probar y actualizar. 

Los científicos de la computación han estudiado sistemáticamente los factores y los procedimien- 
tos necesarios para desarrollar software de alta calidad de este tipo. En esencia la programación es- 
tructurada es un conjunto de reglas que prescriben buenos hábitos de estilo para el programador. 
Aunque la programación estructurada es bastante flexible para permitir considerable creatividad y 
expresión personal, sus reglas imponen suficientes restricciones para hacer que los programas resul- 
tantes sean muy superiores a sus versiones no estructuradas. En particular, el producto terminado es 
mucho más elegante y fácil de entender. 

La idea clave detrás de la programación estructurada es que cualquier algoritmo numérico re- 
quiere tan sólo de tres estructuras de control fundamentales: secuencia, selección y repetición. Limi- 
tándonos a dichas estructuras el programa resultante será claro y fácil de seguir. 

En los párrafos siguientes describiremos cada una de estas estructuras. Para mantener esta 
descripción de una manera general usaremos diagramas de flujo y pseudocódigo. Un diagrama de 


Flujo es una representación visual o gráfica de un algoritmo. Un diagrama de flujo emplea una serie 


de bloques y flechas, cada una de las cuales representa un determinado paso u operación del algo- 
ritmo (figura 2.1). Las flechas representan el orden en el que se realizarán las operaciones. 

No todas las personas relacionadas con la computación están de acuerdo en que los diagramas 
de flujo sean un esfuerzo productivo, de hecho, algunos programadores experimentados no usan los 
diagramas de flujo. Sin embargo, nosotros pensamos que existen tres buenas razones para estudiar- 
los. La primera es que sirven para expresar y comunicar algoritmos. La segunda es que aunque no 


SÍMBOLO FUNCIÓN 


ón á Líneas de flujo 


Proceso 


NOMBRE 


Terminal 


Entrada/Salida 


Decisión 

alternativos a seguir. 
Unión 
Conexión de fin 
de página 


«¿3 Ciclo de cuenta 
controlada 

Figura 2.1 

Símbolos usados en los diagramas de flujo. 
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Representa el inicio o el final de un programa. 


Representan el flujo de la lógica. Los arcos en la flecha horizontal indican que ésta pasa sobre 
las líneas de flujo verticales y no se conecta con ellas. 


Representa cálculos o manipulación de datos. 
Representa entrada o salida de datos e información. 


Representa una comparación, una pregunta o una decisión que determina los caminos 


Representa la confluencia de líneas de flujo. 


Representa una interrupción que continúa en otra página. 


Se usa para ciclos que repiten un número predeterminado de iteraciones. 


se empleen de manera rutinaria, algunas veces resultarán útiles para planear, aclarar o comunicar la 
lógica del propio programa o del de otra persona. Por último, que es lo más importante para nuestros 


objetivos, son excelentes herramientas didácticas. Desde el 
punto de vista de la enseñanza, son los medios ideales para 
visualizar algunas de las estructuras de control fundamentales 
que se emplean en la programación. 

Otra manera de expresar algoritmos, y que constituye un 
puente de unión entre los diagramas de flujo y el código de la 
computadora, es el pseudocódigo. En esta técnica se utilizan 
expresiones semejantes a las del código, en lugar de los sím- 
bolos gráficos del diagrama de flujo. En esta obra, para el 
pseudocódigo hemos adoptado algunas convenciones de estilo. 
Escribiremos con mayúsculas las palabras clave como IF, DO, 
INPUT, etc., mientras que las condiciones, pasos del proceso 
y tareas irán con una sangría. Además, los pasos del proce- 
so se escribirán con una sangría. De esta manera las palabras 
clave forman un “sándwich” alrededor de los pasos para defi- 
nir visualmente lo que abarca cada estructura de control. 

Una ventaja del pseudocódigo es que con él resulta más 
fácil desarrollar un programa que con el diagrama de flujo. El 
pseudocódigo es también más fácil de modificar y de com- 
partir con los demás. No obstante, los diagramas de flujo, 
debido a su forma gráfica, resultan a veces más adecuados 
para visualizar algoritmos complejos. Nosotros emplearemos 
diagramas de flujo con fines didácticos, y el pseudocódigo 
será el principal medio que usaremos para comunicar algorit- 
mos relacionados con métodos numéricos. 


2.2.1 Representación lógica 


Secuencia La estructura secuencial expresa la trivial idea 
de que, a menos que se indique otra cosa, el código debe rea- 


Diagrama de flujo Pseudocódigo 


Condición A 
IF condición THEN 


Bloque verdadero 
ENDIF 


Bloque 
verdadero 


a) Estructura (IF/THEN) para una sola alternativa 


Condició Verdadero 
o IF condición THEN 
Bloque verdadero 


ELSE 
Bloque Bloque Bloque falso 
falso verdadero ENDIF 


b) Estructura (IF/THEN/ELSE) para dos alternativas 


Figura 2.2 

Diagrama de flujo y pseudocódigo para estructuras de selec- 
ción simple. a) Selección con una alternativa (IF/THEN) y 

b) selección con dos alternativas (IF/THEN/ELSE). 
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Instrucción; 


Instrucción, 


Instrucción; 

| Instrucción; 
Instrucción; 

Instrucción; Instrucción, 


| 


Instrucción, 


a) Diagrama de flujo  b) Pseudocódigo 


Figura 2.3 
a) Diagrama de flujo y b) pseudocódigo 
para una estructura secuencial. 


Valor; 


lizarse instrucción por instrucción. Como en la figura 2.2, la estructura se puede 
expresar de manera general como un diagrama de flujo o como un pseudocódigo. 


Selección En contraste con el paso por paso de la estructura secuencial, la 
selección nos ofrece un medio de dividir el flujo del programa en ramas con- 
siderando el resultado de una condición lógica. La figura 2.3 muestra las dos 
principales formas de hacer esto. 

La decisión ante una sola alternativa, o estructura /F/THEN (figura 2.3a), 
nos permite una desviación en el flujo del programa si una condición lógica es 
verdadera. Si esta condición es falsa no ocurre nada y el programa continúa con 
la indicación que se encuentra después del ENDIF. La decisión ante dos alterna- 
tivas, o estructura IF/THEN/ELSE (figura 2.3b), se comporta de la misma ma- 
nera si la condición es verdadera; sin embargo, si la condición es falsa, el 
programa realiza las instrucciones entre el ELSE y el ENDIF. 

Aunque las estructuras IF/THEN e IF/THEN/ELSE son suficientes para 
construir cualquier algoritmo numérico, por lo común también se usan otras dos 
variantes. Suponga que el ELSE de un IF/THEN/ELSE contiene otro IF/THEN. 
En tales casos el ELSE y el IF se pueden combinar en la estructura /¡F/THEN/ 
ELSEIF que se muestra en la figura 2.4a. 


Diagrama de flujo Pseudocódigo 


IF condición, THEN 
Bloque 

Bloques | ELSEIF condición, 
B10que> 

ELSEIF condición; 
Bloquez 

ELSE 
Bloque, 

ENDIF 


a) Estructura con múltiples alternativas (IF/THEN/ELSEIF) 


SELECT CASE Expresión de prueba 
CASE Valor; 
Bloque; 
CASE Valor, 
Bloque, 
CASE Valor; 
Bloque; 


Expresión 
de prueba 


Bloque; 


Bloque, Bloquez Bloque, CASEREIES.S 


Figura 2.4 


Bloque, 
END SELECT 


b) Estructura CASE (SELECT o SWITCH) 


Diagrama de flujo y pseudocódigo para construcciones de selección o ramificación. a) Selección de 
múltiples alternativas (IF/THEN/ELSEIF) y b) Construcción CASE. 
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Observe que en la figura 2.4a hay una cadena o “cascada” de decisiones. La primera es una 
instrucción IF y cada una de las decisiones sucesivas es un ELSEITF. Siguiendo la cadena hacia aba- 
jo, la primera condición que resulte verdadera ocasionará una desviación a su correspondiente bloque 
de código, seguida por la salida de la estructura. Al final de la cadena de condiciones, si todas las 
condiciones resultaron falsas, se puede adicionar un bloque ELSE opcional. 

La estructura CASE es una variante de este tipo de toma de decisiones (figura 2.4b). En lugar 
de probar condiciones individuales, las ramificaciones dependen del valor de una sola expresión de 
prueba. Según sea su valor, se presentarán diferentes bloques de código. Además, si la expresión no 
toma ninguno de los valores previstos, se puede proponer un bloque opcional (CASE ELSE). 


Repetición La repetición nos proporciona una manera de 
llevar a cabo instrucciones repetidamente. Las estructuras 
resultantes, llamadas loops o ciclos, se presentan en dos formas 
distintas que se diferencian por la manera en que terminan. 

El primer tipo, y el fundamental, es el llamado ciclo de 
decisión debido a que termina basándose en el resultado de una 
condición lógica. La figura 2.5 muestra el tipo general de ciclo 
de decisión, la construcción DOEXTT., también llamada ciclo de 
interrupción (break ciclo). Esta estructura realiza repeticiones 
hasta que una condición lógica resulte verdadera. 

En esta estructura no es necesario tener dos bloques. 
Cuando se omite el primer bloque, a la estructura se le suele 
llamar ciclo de preprueba porque la prueba lógica se realiza 
antes de que ocurra algo. Si se omite el segundo bloque, se le 
llama ciclo posprueba. Al caso general (figura 2.5), en el que 
se incluyen los dos bloques, se le llama ciclo de prueba inter- 
media (midtest ciclo). 

Hay que hacer notar que el ciclo DOEXIT fue introduci- 
do en Fortran 90 para tratar de simplificar los ciclos de deci- 
sión. Esta estructura de control es parte estándar del lenguaje Figura 2.5 
VBA de macros en Excel; pero no forma parte estándar de C- Ciclo DOEXIT o de interrupción. 
ode MATLAB, que usan la estructura llamada WHILE. Como 
nosotros consideramos superior a la estructura DOEXIT, la 
hemos adoptado en este libro como la estructura de ciclo de decisión. Para que nuestros algoritmos 
se realicen tanto en MATLAB como en Excel, mostraremos más adelante, en este capítulo (véase la 
sección 2.5), cómo simular el ciclo de interrupción usando la estructura WHILE. 

Al ciclo de interrupción que se presenta en la figura 2.5 se le llama ciclo lógico porque termina 
a causa de una condición lógica. Por otro lado, se tiene el ciclo controlado por contador o ciclo 
DOFOR (figura 2.6) que realiza un número determinado de repeticiones o iteraciones. 

El ciclo controlado por contador funciona como sigue. El índice (representado por í en la figura 
2.6) es una variable a la que se le da un valor inicial. El programa prueba si el índice es menor o 
igual al valor final, fin. Si es así, entonces ejecuta el cuerpo del ciclo y vuelve al DO. Cada vez que 
encuentra el ENDDO el índice se incrementa automáticamente con el valor definido por el incre- 
mento. De manera que el índice actúa como un contador. Cuando el índice es mayor que el valor 
final (fin), la computadora sale automáticamente del ciclo y transfiere el control a la línea que sigue 
después del ENDDO. Observe que casi en todos los lenguajes de programación, incluyendo Excel y 
MATLAB, si se omite el incremento, la computadora supone que éste es igual a 1.? 

Los algoritmos numéricos que se describen en las páginas siguientes se desarrollarán usando 
únicamente las estructuras presentadas en las figuras 2.2 a 2.6. El ejemplo siguiente presenta el 
método básico para desarrollar un algoritmo que determine las raíces de la ecuación cuadrática. 


Diagrama de flujo 


2Se puede usar incremento (decremento) negativo, en cuyo caso el ciclo termina cuando el índice es menor que el valor final. 
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Pseudocódigo 


DO 
Bloque; 
IF condición EXIT 
Bloque, 

ENDDO 
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Verdadero 


¡= inicio 


i=i+incr. 
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Diagrama de flujo Pseudocódigo 


DOFOR ¡1 = inicio, fin, incremento 
Bloque 
ENDDO 
Figura 2.6 
Construcción controlada por conteo o construcción 
DOFOR. 


EJEMPLO 2.1 Algoritmo para las raíces de la ecuación cuadrática 


Planteamiento del problema Las raíces de una ecuación cuadrática 
a?+bx+c=0 
se determinan mediante la fórmula cuadrática, 


X,  —b+x|b* -4ac| (E2.1.1) 


X> 2a 


Desarrolle un algoritmo que haga lo siguiente: 


Paso 1: Pida al usuario los coeficientes a, b y c. 

Paso 2: Realice las operaciones de la fórmula cuadrática previendo todas las eventualidades (como, por 
ejemplo, evitar la división entre cero y permitir raíces complejas). 

Paso 3: Dé la solución, es decir, los valores de x. 

Paso 4: Dé al usuario la opción de volver al paso 1 y repetir el proceso. 


Solución Para desarrollar el algoritmo usaremos un método que va de lo general a lo particular 
(método top-down). Esto es, iremos refinando cada vez más el algoritmo en lugar de detallar todo a 
la primera vez. 

Para hacerlo, supongamos, para el presente ejemplo, la fórmula cuadrática es infalible sin impor- 
tar los coeficientes (obviamente no es cierto, pero por ahora basta). Un algoritmo estructurado para 
realizar la tarea es 


DO 
INPUT a, b, Cc 
PA = (Ao s* SORT (1 = Lac (2) 
Fe = (A = SORT (0 = Lac) (2) 
DISPLAY rl, r2 
DISPLAY "¿Repetir? Conteste sí o no' 
INPUT respuesta 


IF respuesta = 'no' EXIT 
ENDDO 


La construcción DOEXIT se utiliza para repetir el cálculo de la ecuación cuadrática siempre 
que la condición sea falsa. La condición depende del valor de la variable de tipo carácter respuesta. 
Si respuesta es igual a “sí” entonces se llevan a cabo los cálculos. Si no es así, si respuesta es igual 
a “no”, el ciclo termina. De esta manera, el usuario controla la terminación mediante el valor de 
respuesta. 

Ahora bien, aunque el algoritmo anterior funcionará bien en ciertos casos, no es infalible. El 
algoritmo quizá no funcione para algunos valores de las variables. Esto es: 
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+ Sia=0se presentará inmediatamente un problema debido a la división entre cero. Si inspec- 
cionamos cuidadosamente la ecuación (2.1) veremos que aquí se pueden presentar dos casos: 
S1b% 0, la ecuación se reduce a una ecuación lineal con una raíz real, —c/b. 

Si b=0, entonces no hay solución. Es decir, el problema es trivial. 

* Siax0, entonces, según sea el valor del discriminante, d = b?—4ac, se pueden presentar también 

dos casos: 
Si d > 0, habrá dos raíces reales. 
Si d < 0, habrá dos raíces complejas. 


Observe cómo hemos dejado una sangría adicional para hacer resaltar la estructura de decisión 
que subyace a las matemáticas. Esta estructura se traduce, después, en un conjunto de estructuras 
IF/THEN/ELSE acopladas que se pueden insertar en la parte con los comandos sombreados en el 
código anterior, obteniéndose finalmente el algoritmo: 


DO 
INPUT a, b, c 
ri = 0 P2= Us JU = 0 12 =0 
FE => 0 Male 
IF bx 0 THEN 


pi = =/10 
ELSE 

DISPLAY ESOlUCIÓN crTVISIS 
ENDIF 


ELSE 
aser = 16 =-d=a=0C 
WE ser 0 NIE 
ri = (o + Sarttaiscr JJ (2 a) 
r2= (Ho = Serutaiserl (2 * a) 


ELSE 
pl = yz * a) 
ra = Pl 
il = Sare(Aos ies cry (2 2) 
2 = =1 
ENDIF 
ENDIF 


DIUSPLAO? Po, PE, Ulla ME 


DISPLAY “¿Repetir? Conteste sí o no” 
INPUT respuesta 


IF respuesta = “no” EXIT 
ENDDO 


El método que se utilizó en el problema anterior puede emplearse para desarrollar un algoritmo 
para el problema del paracaidista. Recordemos que, dadas la condición inicial para tiempo y veloci- 
dad, el problema consistía en resolver de manera iterativa la fórmula 

dv, 

Vi =0,+ Er At (2.1) 
Como sabemos, para lograr una buena precisión será necesario emplear incrementos pequeños. Por 
lo que será necesario emplear la fórmula repetidas veces, desde el tiempo inicial hasta el tiempo 
final. En consecuencia, un algoritmo para resolver este problema estará basado en el uso de un ciclo. 

Supongamos, por ejemplo, que empezamos los cálculos en £ = 0 y queremos predecir la veloci- 
dad en £= 4 s con incrementos de tiempo Af=0.5 s. Entonces tendremos que aplicar la ecuación (2.1) 
ocho veces, esto es, 


4 


= ——=8 
0.5 


n 
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donde n es el número de iteraciones del ciclo. Como este número es exacto, es decir, esta división 
nos da un número entero, podemos usar como base del algoritmo un ciclo controlado por contador. 
A continuación damos un ejemplo de pseudocódigo. 


g= 9.81 

INPUT cd, m 

ENPUE Tis Vhs EF qí 
t= ti 

v= v1 


Mm= (ir = 60) / al 
DOFOR ¡= 1 TO n 
alvaie = 1 = (cal mm) Y 


v= v + dvdt * dt 
t= t+ dt 

ENDDO 

DISPLAY v 


Aunque este esquema es fácil de programar, no está completo. Sólo funcionará si el intervalo es 
divisible exactamente entre el incremento.* Para tomar en cuenta el otro caso, en el pseudocódigo 
anterior, en lugar del área sombreada se puede usar un ciclo de decisión. El resultado es: 


g = 9.81 
INPUT cd, m 
ENPUT Tis Vhs EF. qt 
t= ti 
v= v1 
h= dt 
DO 
E A 
MM = uf = 
ENDIF 
alvate = E = ica / mm) *v 
Y = 1% == elvalte -1g 
=> Sel 
WE TEL EN 
ENDDO 
DISPLAY v 


Al introducir el ciclo, usamos la estructura IF/THEN para probar si el valor £ + dí nos lleva más 
allá del final del intervalo. Si no es así, lo cual comúnmente será el caso al principio, no hacemos 
nada. De lo contrario, necesitaremos reducir el intervalo haciendo el tamaño de incremento h igual 
a tf—t. Así, garantizamos que el paso siguiente caiga precisamente en £f. Después de hacer este paso 
final, el ciclo terminará, debido a que 1 > tf será verdadero. 

Observe que antes de entrar en el ciclo hemos asignado el valor del incremento, dt, a otra va- 
riable, h. Creamos esta variable con el objeto de que nuestra rutina no cambie el valor de dt cuando 
tengamos que reducir el incremento. Hacemos esto anticipándonos a que tengamos que usar el 
valor original de di en algún otro lado, en el caso de que este programa sea parte de otro programa 
mayor. 

Hay que destacar que este algoritmo aún no está terminado. Puede ser, por ejemplo, que el 
usuario dé por error un incremento que sea mayor que el intervalo, como por ejemplo, tf— ti = 35 y 
dt = 20. Entonces, habrá que poner, en el programa, instrucciones que detectan tales errores y que 
el usuario pueda corregirlos. 


¿Este problema se combina con el hecho de que las computadoras usan internamente, para la representación de números, la 
base 2. En consecuencia, algunos números que aparentemente son divisibles no dan exactamente un entero cuando la división 
se hace en una computadora. De esto hablaremos en el capítulo 3. 
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2.3 PROGRAMACIÓN MODULAR 


Imaginemos qué difícil sería estudiar un libro que no tuviera capítulos, ni seccio- 
nes, ni párrafos. Dividir una tarea o una materia complicada en partes más acce- 
sibles es una manera de hacerla más fácil. Siguiendo esta misma idea, los 
programas de computación se dividen en subprogramas más pequeños, o módu- 
los que pueden desarrollarse y probarse por separado. A esta forma de trabajar 
se le llama programación modular. 

La principal cualidad de los módulos es que son tan independientes y autosu- 
ficientes como sea posible. Además, en general, están diseñados para llevar a cabo 
una función específica y bien definida, y tienen un punto de entrada y un punto 
de salida. Los módulos a menudo son cortos (por lo general 50 a 100 instrucciones) 
y están bien enfocados. 

En los lenguajes estándar de alto nivel como Fortran 90 y C, el principal 
elemento de programación usado para representar módulos es el procedimiento. 
Un procedimiento es un conjunto de instrucciones para computadora que juntas 
realizan una tarea dada. Se emplean comúnmente dos tipos de procedimientos: 
funciones y subrutinas. Las primeras normalmente dan un solo resultado, mien- 
tras que las últimas dan varios. 

Además, hay que mencionar que gran parte de la programación relacionada 
con paquetes de software como Excel y MATLAB implica el desarrollo de subpro- 
gramas. Así, los macros de Excel y las funciones de MATLAB están diseñadas 
para recibir información, llevar a cabo un cálculo y dar un resultado. De manera 
que el pensamiento modular también es consistente con la manera en que se pro- 
grama en ambientes de paquetes. 


FUNCTION Eulerídt, ti, tf, y1) 
t= ti 
y = y 
h= dt 
DO 
IF t + dt > tf THEN 
h= tf-=t 
ENDIF 
dydt = dy(t, y) 
y = y + dydt * h 
t=t+h 
IF t2 tf EXIT 
ENDDO 
Euler = y 
END EULER 
Figura 2.7 


Pseudocódigo para una función que re- 
suelve una ecuación diferencial usando 
el método de Euler. 


La programación modular tiene diversas ventajas. El uso de unidades pequeñas e independien- 
tes hace que la lógica subyacente sea más fácil de seguir y de entender, tanto para el que desarrolla 
el módulo como para el usuario. Se facilita el desarrollo debido a que se puede perfeccionar cada 
módulo por separado. En proyectos grandes, varios programadores pueden trabajar por separado las 
diferentes partes individuales. En el diseño modular también la depuración y la prueba de un pro- 
grama se simplifican debido a que los errores se pueden encontrar con facilidad. Por último, es más 
sencillo el mantenimiento y la modificación del programa. Esto se debe principalmente a que se 
pueden desarrollar nuevos módulos que realicen tareas adicionales e incorporarlos en el esquema 


coherente y organizado que ya se tiene. 


Aunque todas esas ventajas son razones suficientes para usar módulos, la razón más importan- 
te, relacionada con la solución de problemas numéricos en ingeniería, es que permiten tener una 
biblioteca de módulos útiles para posteriores usos en otros programas. Esta será la filosofía de la 


presente obra: todos los algoritmos serán presentados como módulos. 


El procedimiento anterior se ilustra en la figura 2.7 que muestra una función desarrollada para 
usar el método de Euler. Observe que esa función y las versiones previas difieren en cómo manipu- 
lan la entrada y la salida (input/output). En las versiones anteriores directamente la entrada viene 
(mediante el INPUT) del usuario, y la salida va (mediante el DISPLAY) al usuario. En la función, 


se le da la entrada a ésta mediante su lista de argumentos FUNCTION 


Function Eulerídt, ti, tf, y1) 


y la salida es regresada mediante una asignación 
tf, y1) 


y = Eulerí(dt, ti, 


Observe, además, lo general que se ha vuelto esta rutina. No se hace para nada referencia al caso 
específico del paracaidista. Por ejemplo, dentro de la función, en lugar de llamar a la variable de- 
pendiente v, de velocidad, se le nombra y, de manera más general. Asimismo, note que la derivada 
no se calcula mediante una ecuación explícita dentro de la función. En lugar de ello se llama a otra 
función dy para calcularla, lo cual indica el hecho de que podemos usar esta función en muchos 


problemas distintos, además de encontrar la velocidad del paracaidista. 
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2.4 EXCEL 


Excel es una hoja de cálculo producida por Microsoft, Inc. Las hojas de cálculo son un tipo especial 
de software para matemáticas que permite al usuario ingresar y realizar cálculos en renglones y 
columnas de datos. Como tales, son una versión computarizada de una gran hoja de contabilidad en 
la que se lleva a cabo una gran cantidad de cálculos interrelacionados. Puesto que cuando se modi- 
fica un valor de la hoja, hay que actualizar todos los cálculos, las hojas de cálculo son ideales para 
hacer análisis del tipo “¿y qué pasa sl...?” 

Excel cuenta con varios recursos numéricos interconstruidos como resolución de ecuaciones, 
ajuste de curvas y optimización. Incluye también VBA como un lenguaje de macro que sirve para 
hacer cálculos numéricos. Por último, tiene varias herramientas para la visualización como gráficas 
y superficies de tres dimensiones, que son un valioso complemento para el análisis numérico. En esta 
sección mostraremos cómo se utilizan estos recursos en la solución del problema del paracaidista. 

Para ello, construimos primero una hoja de cálculo sencilla. Como se ve abajo, el primer paso 
consiste en colocar números y letras o palabras en las celdas de la hoja de cálculo. 


: 
2 
3 m 68.1 kg 
4 cd 12.5 kg/s 
5 dt 01 s 
6 
7 t vnum (m/s) vanal (m/s) 
5 0 0.000 
9 2 


Antes de escribir un programa de macro para calcular el valor numérico, podemos facilitar el 
trabajo subsecuente dando nombres a los valores de los parámetros. Para esto, seleccione las celdas 
A3:B5 (la manera más fácil de hacerlo es mover el ratón hasta A3, mantener oprimido el botón iz- 
quierdo del ratón y arrastrarlo hasta B5). Después seleccione, del menú, 


Insert Name Create Left column OK 


Para verificar que todo haya funcionado correctamente, seleccione la celda B3 y verifique que apa- 
rezca la etiqueta “m” en la casilla del nombre (casilla que se encuentra en el lado izquierdo de la 
hoja, justo debajo de las barras del menú). 

Muévase hasta la celda CS e introduzca la solución analítica (ecuación 1.9), 


=9.8*m/cd* (1-exp (-cd/m*A8)) 


Al introducir esta fórmula debe aparecer el valor O en la celda C8. Después copie la fórmula a la 
celda C9 para obtener 16.405 m/s. 

Todo lo anterior es típico del uso estándar de Excel. Hecho esto, podría, por ejemplo, cam- 
biar los valores de los parámetros y observar cómo se modifica la solución analítica. 

Ahora mostraremos cómo se usan las macros de VBA para extender los recursos estándar. En 
la figura 2.8 se da una lista que contiene, para cada una de las estructuras de control dadas en la 
sección anterior (figuras 2.2 a2.6), el pseudocódigo junto con el código VBA de Excel. Observe que, 
aunque los detalles difieren, la estructura del pseudocódigo y la del código VBA son idénticas. 

Ahora podemos usar algunas de las construcciones dadas en la figura 2.8 para escribir una 
función de macro que calcule la velocidad. Para abrir VBA seleccione? 


Tools Macro Visual Basic Editor 


*¡La combinación de las teclas Alt-F11 es más rápida! 


2.4 Excel 


Una vez dentro del Visual Basic Editor (VBE), seleccione 


Insert Module 


y se abrirá una nueva ventana para código. La siguiente función en VBA se puede obtener directa- 
mente del pseudocódigo de la figura 2.7. Escriba la función dentro de la ventana del código. 


Option Explicit 


Function Euler (dt, ti, tf, yi, m, cd) 


Dim h As Double, t As Double, y As Double, dydt As Double 


t=ti 
y = yi 
h = dt 
Do 
Tf t + dt > tf Then 
h=tf-t 
End If 


dydt = dy(t, y, m, cd) 
y = y + dydt * h 
E 


t = + h 

If t >= tf Then Exit Do 
Loop 
Euler = y 


End Function 


Compare esta macro con el pseudocódigo de la figura 2.7 y vea que son muy similares. Obser- 
ve también cómo la lista de argumentos de la función se hizo más larga al incluir los parámetros 
necesarios para el modelo de la velocidad del paracaidista. La velocidad obtenida, v, pasa a la hoja 
de cálculo mediante el nombre de la función. 

Note también cómo, para calcular la derivada, hemos usado otra función. Ésta se puede intro- 
ducir en el mismo módulo tecleándola directamente debajo de la función Euler, 


Function dy(t, v, m, cd) 
Const g As Double = 9.81 
dy = 9 - (cd / m) * v 
End Function 


El paso final consiste en volver a la hoja de cálculo y llamar a la función introduciendo la si- 
guiente expresión en la celda B9 


=Euler (dt,A8,A9,B8,m,cd) 


El resultado de la integración numérica, 16.531, aparecerá en la celda B9. 

Vamos a ver qué ha pasado aquí. Cuando usted da la función en la celda de la hoja de cálculo, 
los parámetros pasan al programa VBA, donde se realizan los cálculos y, después, el resultado re- 
gresa a la celda. En efecto, el lenguaje de macros VBA le permite usar Excel como mecanismo de 
entradas y salidas (input/output). Esta característica resulta de mucha utilidad. 

Por ejemplo, ahora que ya tiene todos los cálculos, puede jugar con ellos. Suponga que el para- 
caidista fuera mucho más pesado, digamos, m = 100 kg (alrededor de 220 libras). Introduzca 100 en 
la celda B3 y la hoja de cálculo se modificará de inmediato mostrando el valor 17.438 en la celda B9. 
Cambie la masa nuevamente a 68.1 kg y el resultado anterior, 16.531 reaparecerá de forma automá- 
tica en la celda B9. 

Ahora vayamos un poco más adelante dando algunos valores más para el tiempo. Introduzca 
los números 4, 6, ..., 16 en las celdas A10 a A16. Después copie las fórmulas de las celdas B9:C9 
hacia abajo en los renglones 10 a 16. Observe cómo el programa VBA calcula correctamente los 
resultados numéricos en cada uno de los nuevos renglones. (Para verificar esto cambie el valor de dt 
por 2 y compare los resultados con los cálculos a mano obtenidos anteriormente, en el ejemplo 1.2.) 
Para mejorar la presentación se pueden graficar los resultados en un plano x-y usando Excel Chart 
Wizard. 


31 


32 


Capítulo 2 Programación y software 


a) Pseudocódigo b) Excel VBA 

IF/THEN: 

IF condición THEN If b <> 0 Then 
Bloque verdadero rl==c f/f b 

ENDIF End If 

IF/THEN/ELSE: 


IF condición THEN 
Bloque verdadero 


If a < 0 Then 
b = Sqrí(Abs(a)) 


ELSE Else 
Bloque falso b = Sgría) 

ENDIF End If 

IF/THEN/ELSEIF: 

IF condición, THEN If class = 1 Then 
B1oque, x=x>3w*8 

ELSEIF condición, Elself class < 1 Then 
Bloque, x=x-08 

ELSEIF condición, Elself class < 10 Then 
Bloque, o E 

ELSE Else 
Bloque, x=x> 6% 

ENDIF End If 

CASE: 


SELECT CASE Expresión de prueba 
CASE Valor, 


Select Case a + b 
Case ls < -—50 


Bloque, Xx == 
CASE Valor, Case Is<0 
Bloque, x==5b-= (a +b)/ 10 
CASE Valor, Case Is < 50 
Bloque, x= (a + b)/ 10 
CASE ELSE Case Else 
Bloque, x= 5 
END SELECT End Select 
DOEXIT: 
DO Do 
B1oque, 1=1 +1 
IF condición EXIT If 1 >= 10 Then Exit Do 
Bloque, j= 1*x 
ENDIF Loop 
LOOP CONTROLADO POR CONTADOR: 
DOFOR 1 = inicio, fin, incremento For 1 = 1 To 10 Step 2 
Bloque x= Xx +A1 
ENDDO Next 1 
Figura 2.8 


Estructuras de control fundamentales en a) pseudocódigo y b) VBA de Excel. 


Abajo se muestra la hoja de cálculo resultante. Hemos creado una valiosa herramienta para la 
solución de problemas. Puede realizar un análisis de sensibilidad cambiando los valores de cada uno 
de los parámetros. Cada vez que se introduce un nuevo valor, se actualizarán automáticamente los 
cálculos y la gráfica. Tal característica de interactividad es lo que hace tan potente a Excel. No obs- 
tante, se debe reconocer que resolver este problema dependerá de la habilidad para escribir el macro 


en VBA. 


2.5 MATLAB 


A B c D E G H !] J 
1 Problema del paracaidista 
3 60 
3 m 68.1 kg 
2 cd 12.5 kg/s 50 - E 
5 ¡dt 0.15 a” 
6 40 
7t wnum (m/s) vanal (m/s) 
3 0 0.000 0.000 |30 
9 2 16.548 16.422 
10 4 27.972 271.198 
1” 6 35.859 35.678 E A E vnum(m/s) 
Y 8 41.304 41137 (50 — — vanal (m/s) 
13 10 45.063 44.919 
14 12 47.658 47.539 
15 14 49,450 49,353 El 
16 16 50.687 50.611 2 2 2 ] 


La combinación del ambiente de Excel con el lenguaje de programación VBA nos abre un mun- 
do de posibilidades para la solución de problemas en ingeniería. En los capítulos siguientes ilustra- 
remos cómo se logra esto. 


2.5 MATLAB 


MATLAB es el principal producto de software de The MathWorks, Inc., fundada por los analistas numé- 
ricos Cleve Moler y John N. Little. Como su nombre lo indica, MATLAB se desarrolló original- 
mente como un laboratorio para matrices. Hoy, el elemento principal de MATLAB sigue siendo la 
matriz. La manipulación matemática de matrices se ha realizado muy adecuadamente en un ambien- 
te interactivo fácil de utilizar. A esta manipulación matricial, MATLAB agrega varias funciones 
numéricas, cálculos simbólicos y herramientas para visualización. En consecuencia, la versión actual 
representa un ambiente computacional bastante amplio. 

MATLAB tiene diferentes funciones y operadores que permiten la adecuada realización de los 
métodos numéricos que aquí desarrollamos. Éstos se describirán con detalle en los capítulos siguien- 
tes. Además, se pueden escribir programas como los llamados archivos M (M-files) que sirven para 
realizar cálculos numéricos. Vamos a explorar cómo funciona. 

Primero, usted se dará cuenta de que el uso normal de MATLAB está estrechamente relaciona- 
do con la programación. Supongamos, por ejemplo, que queremos determinar la solución analítica 
al problema del paracaidista, lo cual haríamos con los siguientes comandos de MATLAB 


>> g=9.81; 

>> m=68.1; 

>> cd=12.5; 

>> tf=2; 

>> v=g*m/cd* (1-exp (-cd/m*tf)) 


obteniéndose como resultado 


SE = 
16.4217 


La secuencia de comandos es como la secuencia de instrucciones en un lenguaje de programación 
típico. 

Pero, ¿qué ocurre si usted se quiere desviar de la estructura secuencial? Aunque hay algunos 
caminos bien definidos para establecer recursos no secuenciales en el modo estándar de comandos, 
para introducir decisiones y ciclos, lo mejor es crear un documento de MATLAB al que se le llama 
archivo M (M-file). Para hacer esto haga clic en 


File New Script 
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y se abrirá una ventana nueva con el encabezado “MATLAB Editor/Debugger”. En esta ventana 
usted puede escribir y editar programas en MATLAB. Escriba ahí el código siguiente: 


g=9.81; 

m=68.1; 

cd=12.5; 

tf=2; 
v=g*m/cd* (1-exp (-cd/m*tf)) 


Obsérvese que los comandos se escriben exactamente en la misma forma en que se haría en el 
extremo frontal de MATLAB. Guarde el programa con el mismo nombre: analpara. MATLAB 
agregará en forma automática la extensión .m para denotar que se trata de un archivo M: analpara.m. 

Para correr el programa, se debe regresar al modo de comando. La forma más directa de efectuar 
esto consiste en hacer clic en el botón “MATLAB Command Window” que se encuentra en la barra 
de tareas (que por lo general está en la parte inferior de la pantalla). 

Ahora, el programa se puede correr al hacer clic en el archivo M, analpara, que debe parecerse 
a lo siguiente: 


>> analpara 


Si usted ha hecho todo en forma correcta, MATLAB debe responder con la respuesta correcta: 


V = 
16.4217 


Ahora, un problema con lo anterior es que está preparado para calcular sólo un caso. El lector 
lo puede hacer más flexible si hace que el usuario introduzca algunas de las variables. Por ejemplo, 
suponga que desea evaluar el efecto de la masa sobre la velocidad a los 2 s. Para hacer esto, el archi- 
vo M podría reescribirse como sigue: 


g=9.81; 

m=input ('masa (kg):'); 
cd=12.5; 

tf=2; 
v=g*m/cd* (1-exp (-cd/m*tf)) 


Guarde esto con el nombre de analpara2.m. Si escribió analpara2 mientras se encontraba en el modo 
de comando, la línea mostrará lo que sigue: 


masa (kg): 
Entonces, el usuario introduce un valor como 100, y el resultado aparecerá como: 


V = 
1 


Ahora, debe quedar bastante claro cómo se puede programar una solución numérica por medio 
de un archivo M. A fin de hacerlo, primero debemos entender la manera en que MATLAB maneja 
las estructuras lógica y de lazo (ciclos o loops). En la figura 2.9 se enlista el pseudocódigo junto con 
el código de MATLAB para todas las estructuras de control, con base en la sección anterior. Aunque 
las estructuras del pseudocódigo y el código MATLAB son muy similares, existen algunas diferen- 
cias pequeñas que deben destacarse. 

En especial, observe cómo hemos expresado la estructura DOEXIT. En lugar del DO usamos 
el WHILE(1). Como MATLAB interpreta al número 1 como correspondiente a “verdadero”, esta 
instrucción se repetirá indefinidamente de la misma manera que el DO. El loop termina con un 
comando de interrupción (break), el cual transfiere el control a la instrucción que se encuentra a 
continuación, de la instrucción end que termina el ciclo. 


2.5 MATLAB 


También hay que observar que los parámetros del lazo controlado por contador están ordenados 
de modo diferente. Para el pseudocódigo, los parámetros del lazo están especificados como start, 
finish, step. Para MATLAB, los parámetros están ordenados como start:step: finish. 

Ahora el siguiente archivo M de MATLAB se puede desarrollar directamente, a partir del 
pseudocódigo dado en la figura 2.7. Escriba lo siguiente en el Editor/Debugger de MATLAB: 


g=9.81; 
m=input ('mass (kg):'); 
cd=12.5; 
ti=0; 
tf=2; 
vi=0; 
dt=0.1; 
t = ti; 
v= vi; 
h = dt; 
while (1) 
if t + dt > tf 
h = tft; 


end 

dvdt = 9 -= (cd / m) * v; 

Vx=wv + dvdt * h; 

t:=-t + hs 

if t >= tf, break, end 
end 
disp('velocity (m/s):') 
disp (v) 


Guarde este archivo como numpara.m, vuelva al modo de comandos y córralo dando numpara. 
Obtendrá la siguiente salida: 


masa (kg): 100 


velocity (m/s): 
17.4559 


Por último vamos a convertir este archivo M en una función. Esto se puede hacer en el siguien- 
te archivo M basado en el pseudocódigo de la figura 2.7: 


function yy = euler (dt,ti,tf,yi,m,cd) 


t = ti; 
y = yi; 
h = dt; 
while (1) 


if t + dt > tf 
hh = tt == 


dydt = dy(t, y, m, cd); 
y = y + dyot * h; 
t 


t. = + h; 

if t >= tf, break, end 
end 
YY = Y; 


Guarde este archivo como euler.m y después cree otro archivo M para calcular la derivada, 


function dydt = dy(t, v, m, cd) 
g = 9.81; 
dydt = g - (cd / m) * v; 


Guarde este archivo como dy.m y regrese al modo de comandos. Para llamar la función y ver el re- 
sultado, teclee los siguientes comandos 
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a) Pseudocódigo b) MATLAB 
IF/THEN: 
IF condición THEN if ib ==.0 
Bloque verdadero rl.= ==: Dz 
ENDIF end 
IF/THEN/ELSE: 
IF condición THEN ifac<o0 
Bloque verdadero b = sqrtí(abs(a)); 
ELSE else 
Bloque falso b = sgrtía); 
ENDIF end 
IF/THEN/ELSEIF: 
IF condición, THEN if class == 1 
B1oque, x=x+8; 
ELSEIF condición, elseif class < 1 
Bloque, O RS 
ELSEIF condición, elseif class < 10 
Bloque, XENA 
ELSE else 
Bloque, x=x>-— 64; 
ENDIF end 
CASE: 


SELECT CASE Expresión de prueba switch a + b 


CASE Valor, case 1 
Bloque, x= 0 
CASE Valor, case 2 
Bloque, x=-—5-= (a+ b)/ 10; 
CASE Valor, case 3 
Bloque, x= (a +b) / 10; 
CASE ELSE otherwise 
Bloque, 2 03 
END SELECT end 
DOEXIT: 
DO while (1) 
B1oque, i=3i+l; 
IF condición EXIT if 1 >= 10, break, end 
Bloque, JA 
ENDDO end 
LOOP CONTROLADO POR CONTADOR: 
DOFOR 1 = inicio, fin, incremento for i= 1:2:10 
Bloque xX=xXx+i1; 
ENDDO end 


Figura 2.9 
Estructuras de control fundamentales en a) pseudocódigo y b) lenguaje de programación en MATLAB. 


>> m=68.1; 

>> cd=12.5; 

>> ti=0; 

>> tf=2.; 

>> vi=0; 

>> dt=0.1; 

>> euler (dt,ti,tf,vi,m,cd) 


2.7 Otros lenguajes y bibliotecas 


Una vez dado el último comando, se desplegará el resultado 


ans = 
16.5478 


La combinación del ambiente de MATLAB con el lenguaje de programación para los archivos 
M nos abre un mundo de posibilidades para la solución de problemas en ingeniería. En el siguiente 
capítulo veremos cómo se hace esto. 


2.6 MATHCAD 


Mathcad intenta puentear la brecha entre las hojas de trabajo como Excel y los notepads. Original- 
mente fue desarrollado por Allen Razdow, del MIT, quien fuera cofundador de Mathsoft, Inc., y 
publicara la primera versión comercial en 1986. Actualmente, Mathsoft forma parte de Parametric 
Technology Corporation (PTC), y Mathcad se encuentra en la versión 15. 

Mathcad es esencialmente un notepad interactivo que permite a los ingenieros y a los científicos 
realizar diversas tareas matemáticas, de manejo de datos y de tipo gráfico. La información y las 
ecuaciones se ingresan a un ambiente de diseño de “pizarra blanca” (whiteboard), sustancialmente 
similar a una hoja de papel. A diferencia de una herramienta de programación o de una hoja de 
trabajo, la interfaz de Mathcad acepta y muestra notación matemática natural, usando teclas o clics 
en las opciones del menú, sin necesidad de programación. Como las hojas de cálculo contienen 
cálculos en vivo, un solo golpe de teclado, que cambie un dato ingresado o una ecuación, devuelve 
instantáneamente un resultado actualizado. 

Mathcad puede realizar tareas ya sea en modo numérico o en modo simbólico. En el primero, 
las funciones y los operadores de Mathcad dan respuestas numéricas, mientras que en el segundo, 
los resultados se dan como expresiones o ecuaciones generales. Maple V, un amplio paquete mate- 
mático simbólico, es la base del modo simbólico, y se incorporó a Mathcad en 1993. 

Mathcad tiene una diversidad de funciones y operadores que permite la cómoda implementación 
de muchos de los métodos numéricos que se desarrollan en este libro. Esto se describirá a detalle en 
los capítulos siguientes. En el caso de que usted no esté familiarizado con Mathcad, el apéndice C 
proporciona también una introducción sobre el uso de este poderoso software. 


2.7 OTROS LENGUAJES Y BIBLIOTECAS 


En las secciones 2.4 y 2.5 mostramos cómo se escribe una función en Excel o MATLAB, para el 
método de Euler, a partir de un algoritmo expresado en pseudocódigo. Funciones semejantes se 
escriben en los lenguajes de alto nivel como Fortran 90 y C++. Por ejemplo, una función en Fortran 
90 para el método de Euler es 


Function Euler (dt, ti, tf, yi, m, cd) 


REAL dt, ti, tf, yi, m, cd 
Real h, t, y, dydt 


t=ti 
y = yi 
h = dt 
Do 
If (t + dt > tf£) Then 
h = tft 
End If 


dydt = dy(t, y, m, cd) 
y = y + dydt * h 


t=t<+h 

If (t >= tf) Exit 
End Do 
Euler = y 


End Function 
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En C el resultado sería bastante similar a la función escrita en MATLAB. El punto es que una 
vez que se ha desarrollado bien un algoritmo estructurado en pseudocódigo, es fácil implementarlo 
en diversos ambientes de programación. 

En este libro daremos al lector procedimientos bien estructurados escritos en pseudocódigo. 
Esta colección de algoritmos constituirá una biblioteca numérica, que se puede usar para realizar 
tareas numéricas específicas con diversas herramientas de software y lenguajes de programación. 

Además de tener sus propios programas, usted debe recordar que las bibliotecas comerciales de 
programación tienen muchos procedimientos numéricos útiles. Por ejemplo, la biblioteca Numerical 
Recipe contiene una gran variedad de algoritmos escritos en Fortran y C.* Estos procedimientos se 
describen tanto en libros (por ejemplo, Press ef al., 2007) como en forma electrónica. 


¿Los procedimientos Numerical Recipe también están disponibles en libro y en formato electrónico para Pascal, MS BASIC 
y MATLAB. En http://www.nr.com se puede encontrar la información sobre todos los productos Numerical Recipe. 


PROBLEMAS 


2.1 Escriba el pseudocódigo para implementar el diagrama de flujo 
que se ilustra en la figura P2.1. Asegúrese de incluir la indentación 
apropiada para que la estructura sea clara. 


Figura P2.1 


2.2 Vuelva a escribir el siguiente pseudocódigo usando las sangrías 
adecuadas: 


DO 

j=j+l 
xX=xX>+5 
IFx> 5 THEN 
y=x 

ELSE 

y=0 

ENDIF 
Z=xX>+y 
IF zZ> 50 EXIT 
ENDDO 


2.3 Desarrolle, depure y documente un programa para determinar las 
raíces de una ecuación cuadrática, ax? + bx + c, en cualquier lenguaje 
de alto nivel, o de macros, de su elección. Utilice un procedimiento de 
subrutina para calcular las raíces (sean reales o complejas). Ejecute 
corridas de prueba para los casos en que a) a=1,b=6,c=2;b)a=0, 
b=4,c=1.6;,c)a=3,b=2.5,c=7. 

2.4 La función seno puede evaluarse por medio de la serie infinita 
siguiente: 


Escriba un algoritmo para implementar esta fórmula de modo que 
calcule e imprima los valores de sen x conforme se agregue cada 
término de la serie. En otras palabras, calcule e imprima la secuencia 
de valores para 


sen x= xXx 
al 
Sen xX=Xx — 


3! 

3 5 

JR 
senx=x-=>+— 


31 5! 


hasta el término de orden n que usted elija. Para cada uno de los 
valores anteriores, calcule y haga que se muestre el error porcentual 
relativo: 


valor verdadero — aproximación con la serie 


% error = x 100% 


valor verdadero 


Escriba el algoritmo para a) diagrama de flujo estructurado, y b) 
pseudocódigo. 

2.5 Desarrolle, depure y documente un programa para el problema 2.4 
en cualquier lenguaje de alto nivel o de macros, de su elección. Emplee 
la función seno de la biblioteca de su computadora para determinar el 
valor verdadero. Haga que el programa imprima en cada paso la serie 
de aproximación y el error. Como caso de prueba, utilice el programa 
para calcular valores desde sen(1.5) hasta incluir el término x'*/15! 
Interprete los resultados. 

2.6 El algoritmo siguiente está diseñado para determinar la califica- 
ción de un curso que consiste en cuestionarios, tareas y un examen 
final: 


Paso 1: Introducir la clave y nombre del curso. 

Paso 2: Introducir factores de ponderación para los cuestionarios (C), 
tareas (T) y examen final (E). 

Paso 3: Introducir las calificaciones de las preguntas y determinar su 
promedio (PC). 

Paso 4: Introducir las calificaciones de las tareas y determinar su 
promedio (PT). 

Paso 5: Si el curso tiene una calificación final, continuar con el paso 
6. Si no, ir al paso 9. 

Paso 6: Introducir la calificación del examen final (F). 

Paso 7: Determinar la calificación promedio, CP, de acuerdo con 


_ CxPC+TxPT+EXxF 
_ C+T+E 


x 100% 


Paso 8: Ir al paso 10. 
Paso 9: Determinar la calificación promedio, CP, de acuerdo con 
CxPC+TXxPT 


CP= x 100% 
C+T 


Paso 10: Imprimir la clave y nombre del curso, y la calificación 
promedio. 
Paso 11: Finalizar el cálculo. 

a) Escriba un pseudocódigo bien estructurado para implementar 
este algoritmo. 

b) Escriba, depure y documente un programa estructurado de 
computadora basado en este algoritmo. Pruébelo con los datos 
siguientes para calcular una calificación sin el examen final, y 
otra con éste. C = 30; T = 40; E= 30; cuestionario = 98, 95, 90, 
60 y 99; tareas = 98, 95, 86, 100, 100 y 77, y examen final = 91. 

2.7 El método antiguo de dividir y promediar, para obtener el valor 
aproximado de la raíz cuadrada de cualquier número positivo a se 
puede formular como 


tol = 107% 
x=al2 


| 


Raíz cuadrada = 0 


y = (ax + alx)/2 
e=|0-0)] 
x=y 


| 


Raíz cuadrada = x 


Figura P2.7 
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x+alx 
x= 
2 


a) Escriba un pseudocódigo bien estructurado para implementar 
este algoritmo como se ilustra en la figura P2.7. Utilice la in- 
dentación apropiada para que la estructura sea clara. 

b) Desarrolle, depure y documente un programa para implementar 
esta ecuación en cualquier lenguaje de alto nivel, o de macros, 
de su elección. Estructure su código de acuerdo con la figura 
P2.7. 

2.8 Se invierte cierta cantidad de dinero P en una cuenta en la que 
el interés se capitaliza al final del periodo. Debe determinarse el 
valor futuro, F, que se obtiene con cierta tasa de interés, i, después 
de n periodos, por medio de la fórmula siguiente: 


F=P(l +1) 


Escriba un programa que calcule el valor futuro de una inversión para 
cada año, desde 1 hasta n. La entrada para la función debe incluir la 
inversión inicial, P, la tasa de interés, i (en forma decimal), y el nú- 
mero de años, n, para el que ha de calcularse el valor futuro. La sa- 
lida debe consistir en una tabla con encabezados y columnas para n 
y F. Corra el programa para P= $100000, ¿=0.04 y n= 11 años. 

2.9 Las fórmulas económicas están disponibles para calcular los 
pagos anuales de préstamos. Suponga que obtiene en préstamo cier- 
ta cantidad de dinero P y acuerda devolverla en n pagos anuales con 
una tasa de interés de /. La fórmula para calcular el pago anual A es: 


UA 1(1+1) 
(d+i"-1 


Escriba un programa para calcular A. Pruébelo con P=$55000 y una 
tasa de interés de 6.6% (i = 0.066). Calcule los resultados para n = 
1,2, 3, 4 y 5, y muestre los resultados en forma de tabla con encabe- 
zados y columnas para n y A. 
2.10 La temperatura promedio diaria para cierta área se aproxima 
por medio de la función siguiente, 

T= Tai máxima 7 Emesia) COS(OW(E= Tróxima)) 
donde Truco = temperatura 
máxima, «w = frecuencia de la variación anual (= 277/365) yt... = 
día de la temperatura máxima (= 205 d). Desarrolle un programa que 
calcule la temperatura promedio entre dos días del año para una 
ciudad en particular. Pruébelo para a) enero-febrero (1= 0 a 59) en 
Miami, Florida (7... =22.1%C; T.,;¡,,, =28.37C), y b) julio-agosto 
(+= 180 a 242) en Boston, Massachusetts (7... =10.7%C; Tr; ¡,,, = 
22.9%C). 
2.11 Desarrolle, depure y pruebe un programa en cualquier lenguaje 
de alto nivel, o de macros, de su elección, a fin de calcular la velocidad 
del paracaídas que cae como se explicó en el ejemplo 1.2. Diseñe el 
programa de modo que permita al usuario introducir valores para el 
coeficiente de arrastre y la masa. Pruebe el programa con la reproduc- 
ción de los resultados del ejemplo 1.2. Repita el cálculo pero utilice 
tamaños de paso de 1 y 0.5 s. Compare sus resultados con la solución 
analítica que se obtuvo previamente, en el ejemplo 1.1. Un tamaño de 
paso más pequeño, ¿hace que los resultados sean mejores o peores? 
Explique sus resultados. 
2.12 El método de la burbuja es una técnica de ordenamiento inefi- 
ciente pero fácil de programar. La idea que subyace al ordenamiento 
consiste en avanzar hacia abajo a través de un arreglo, comparar los 
pares adyacentes e intercambiar los valores si no están en orden. Para 


= temperatura promedio anual, £ 


máxima 
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que este método ordene por completo un arreglo, es necesario que se 
repita muchas veces. Conforme se avanza para un ordenamiento en 
orden ascendente, los elementos más pequeños del arreglo parecen 
ascender como burbujas. Eventualmente, habrá un paso por el arreglo 
que ya no requiera intercambios. En ese momento, el arreglo estará 
ordenado. Después del primer paso, el valor más grande cae directa- 
mente hasta el fondo. En consecuencia, el segundo paso sólo tiene 
que proceder del segundo al último valor, y así sucesivamente. De- 
sarrolle un programa que tome un arreglo de 20 números al azar y 
los ordene en forma ascendente con la técnica de la burbuja (véase 
la figura P2.12). 


inicio 


+ 


No 
cambiar 


cambiar 


a; + Art 


cambio = 
verdadero 


Figura P2.12 


2.13 En la figura P2.13 se muestra un tanque cilíndrico con base 
cónica. Si el nivel del líquido está muy bajo en la parte cónica, el 
volumen simplemente es el volumen del cono de líquido. Si el nivel 
del líquido está en la parte cilíndrica, el volumen total de líquido 
incluye la parte cónica llena y la parte cilíndrica parcialmente llena. 
Escriba un procedimiento bien estructurado de función para calcular 
el volumen del tanque como función de los valores dados de R y d. 
Utilice estructuras de control de decisiones (como IHf/Then, Elself, 
Else, End If). Diseñe la función de modo que produzca el volumen 
en todos los casos en los que la profundidad sea menor que 3R. Ge- 
nere un mensaje de error (“Sobrepasado”) si se rebasa la altura del 
tanque, es decir, d > 3R. Pruébelo con los datos siguientes: 


R | 1 1 1 1 
| 0.5 1.2 3.0 3.1 


2R 


> 


Figura P2.13 


2.14 Se requieren dos distancias para especificar la ubicación de un 
punto en relación con el origen en un espacio de dos dimensiones 
(véase la figura P2.14): 


111 IV 


Figura P2.14 


+ Las distancias horizontal y vertical (x, y) en coordenadas carte- 
sianas. 
+ El radio y el ángulo (r, 6) en coordenadas radiales. 
Es relativamente fácil calcular las coordenadas cartesianas (x, y) sobre 
la base de las coordenadas polares (r, 0). El proceso inverso no es tan 
simple. El radio se calcula con la fórmula que sigue: 


r=ax + y? 


Si las coordenadas quedan dentro del primer o cuarto cuadrante (p. ej., 
x > 0), entonces se emplea una fórmula sencilla para el cálculo de 9: 


0= (2) 
Xx 


La dificultad surge en los demás casos. La tabla siguiente resume 
las posibilidades: 


x y 0 

<0 >0 tanUy/x) + x 
<0 <0 tan" (y/x) - zx 
<0 =0 TÍ 

=0 >0 al2 

=0 <0 PA 

=0 =0 0 


a) Escriba un diagrama de flujo bien estructurado para un proce- 
dimiento de subrutina a fin de calcular r y O como función de x 
y y. Exprese los resultados finales para 0, en grados. 

b) Escriba un procedimiento bien estructurado de función con base 
en el diagrama de flujo. Pruebe el programa de modo que se llene 
la tabla que sigue: 


Xx 
1 

il 
0 
1 
1 
1 


0 
1 


. 


2.15 Desarrolle un procedimiento bien estructurado de función que 
lea una calificación numérica entre O y 100 y devuelva una letra, de 
acuerdo con el esquema siguiente: 


Letra Criterio 
A 90 < calificación numérica < 100 
B 80 < calificación numérica < 90 
C 70 < calificación numérica < 80 
D 60 < calificación numérica < 70 
F Calificación numérica < 60 


2.16 Desarrolle un procedimiento bien estructurado de función para 
determinar a) el factorial de un número; b) el valor más pequeño de 
un vector, y c) el promedio de los valores de un vector. 

2.17 Desarrolle programas bien estructurados para a) determinar la 
raíz cuadrada de la suma de los cuadrados de los elementos de un 
arreglo bidimensional (p. ej., una matriz), y b) normalizar una matriz 
por medio de dividir cada renglón entre el valor absoluto máximo en 
el renglón de modo que el elemento mayor en cada renglón sea 1. 
2.18 Las funciones segmentadas son algunas veces útiles cuando la 
relación entre una variable dependiente y una independiente no se 
puede representar adecuadamente con una sola ecuación. Por ejemplo, 
la velocidad de un cohete se puede describir mediante 


111? —5t 0O<t<10 
1100 — 5t 10<1<20 
ví) =4 501 +2(1 20)? 20<1t<30 
1520e 92030 ¿> 30 
0 de otro modo 


Desarrolle una función bien estructurada para calcular v como función 
de f. Luego use esa función para generar una tabla de v contra £ para 
t=-35 a50 a incrementos de 0.5. 

2.19 Desarrolle una función bien estructurada para determinar los 
días transcurridos en un año. La función debe pasar por tres valores: 
mo =el mes (1-12), da =el día (1-31), yl eap (bisiesto) (0 para año 
no bisiesto, y 1 para año bisiesto). Pruébela para 1 de enero de 1999; 
29 de febrero de 2000; 1 de marzo de 2001; 21 de junio de 2002, y 
31 de diciembre de 2004. Sugerencia: Una buena manera de hacer 
esto combina las estructuras f0r y switch. 
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2.20 Desarrolle una función bien estructurada para determinar los 
días transcurridos en un año. La primera línea de una función se debe 
establecer como 


function nd = days(mo, da, 
donde mo = el mes (1-12), da =el día (1-31) y year = año. Pruébelo 
para el 1 de enero de 1999; 29 de febrero de 2000; 1 de marzo de 
2001; 21 de junio de 2002, y 31 de diciembre de 2004. 

2.21 Las ecuaciones de Manning se pueden usar para calcular la 


velocidad del agua en un canal abierto de sección rectangular, 


year) 


2/3 
v-4(_BH Ñ 
on XNB+2B 


donde U = velocidad (m/s), S = pendiente del canal, n = coeficiente 
de rugosidad, B = anchura (m) y A= profundidad (m). Los siguien- 
tes datos están disponibles para cinco canales: 


n Ss B H 
0.035 0.0001 10 2 
0.020 0.0002 8 1 
0.015 0.0010 20 ES 
0.030 0.0007 24 3 
0.022 0.0003 15 245 


Escriba un programa bien estructurado que calcule la velocidad de 
cada uno de estos canales. Haga que el programa muestre los datos 
de entrada junto con la velocidad completada en forma tabular, don- 
de la velocidad es la quinta columna. Incluya encabezados para las 
columnas. 

2.22 La figura P2.22 muestra una viga con un solo apoyo. Con el 
uso de funciones de singularidad, el desplazamiento a lo largo de la 
viga se puede expresar por la ecuación: 


o 15 
LS 0 — (x 6 


57 
+75(x-T1?+ rad — 238.25x 


Uy (x) = 51+ (x — 8) 


Por definición, la función de singularidad se puede expresar como sigue: 


(x—ay" cuando x > a 


(1 ay" = 
0 cuando x < a 


Desarrolle un programa que cree una gráfica de desplazamiento 
contra distancia a lo largo de la viga, x. Observe que x= 0 al extremo 
izquierdo de la viga. 


20 kips/ft 


150 kips-ft 15 kips 


o ==— 


Figura P2.22 
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2.23 El volumen V de líquido en un cilindro hueco horizontal de 
radio r y longitud £ se relaciona con la profundidad del líquido h por 


=:) = 
V = cos )- 0921 L 


r 


Desarrolle una función bien estructurada para crear una gráfica de 
volumen contra profundidad. Pruebe el programa parar=2myL= 
Sm. 

2.24 Desarrolle un programa bien estructurado para calcular la ve- 
locidad de un paracaidista como función del tiempo, usando el mé- 
todo de Euler. Pruebe su programa para el caso en el que m = 80 kg 
y c=10 kg/s. Realice el cálculo a partir de += 0 220 s, con un tama- 
ño de paso de 2 s. Use una condición inicial de que el paracaidista 
tiene una velocidad ascendente de 20 m/s at=0.At=10s, suponga 
que el paracaídas se abre instantáneamente de modo que el coeficien- 
te de arrastre salta a 50 kg/s. 

2.25 El pseudocódigo en la figura P2.25 calcula el factorial. Expre- 
se este algoritmo como una función bien estructurada en el lenguaje 
que elija. Pruébelo calculando 0! y 5! Además, pruebe la trampa de 
errores tratando de evaluar -2! 


FUNCTION fac(n) 
IF n= 0 THEN 
x=1 
DOFOR 1=1,n 
x=Xx>- 1 
END DO 
fac = X 
ELSE 
display error message 
terminate 
ENDIF 
END fac 
Figura P2.25 


2.26 La altura de un pequeño cohete, y, se puede calcular como 
función del tiempo después del lanzamiento con la siguiente función 
segmentada: 


y = 38.14541 + 0.137431? 0<tf<15 


y = 1036 + 130.909 (1— 15) + 6.18425 (+ -— 15) 


— 0.428 (1-15) 15<1t<33 
y =2900 — 62.468 (t— 33) — 16.9274 (1-33? 
+0.41796 (t— 33) 1533 


Desarrolle una función bien estructurada de pseudocódigo para calcu- 
lar y como función de f. Observe que si el usuario ingresa un valor 
negativo de í, o si el cohete ha tocado tierra (y < 0), entonces devol- 
ver un valor de O para y. Asimismo, la función se debe invocar en el 
programa de llamado como height (t).Escriba el algoritmo como 
a) pseudocódigo, o b) en el lenguaje de alto nivel que usted elija. 
2.27 Como se describe en la figura P2.27, un tanque de agua con- 
siste en un cilindro que tiene en la parte superior el frústum de un 
cono. Desarrolle una función bien estructurada en el lenguaje de alto 
nivel o macrolenguaje que usted elija para calcular el volumen dado 
el nivel de agua h (m) sobre el fondo del tanque. Diseñe la función 
de tal manera que devuelva un valor de cero para las h negativas, y 
el valor del volumen máximo lleno para las h mayores que la profun- 
didad máxima del tanque. Dados los siguientes parámetros, H, = 10 
m, r,=4m, A,=53 m y r,=6.5 m, pruebe su función usándola para 
calcular los volúmenes, y genere una gráfica como función del nivel, 
desde h =-—1 hasta 16 m. 


Figura P2.27 


Aproximaciones y errores 
de redondeo 


A causa de que la mayor parte de los métodos expuestos en este libro son muy sencillos en su des- 
cripción y en sus aplicaciones, en este momento resulta tentador ir directamente al cuerpo principal 
del texto y averiguar el empleo de dichas técnicas. Sin embargo, entender el concepto de error es tan 
importante para utilizar en forma efectiva los métodos numéricos que los dos siguientes capítulos se 
eligieron para tratar el tema. 

La importancia de los errores se mencionó por primera vez en el análisis de la caída del para- 
caidista en el capítulo 1. Recuerde que la velocidad de caída del paracaidista se determinó por mé- 
todos analíticos y numéricos. Aunque con la técnica numérica se obtuvo una aproximación a la 
solución analítica exacta, hubo cierta discrepancia o error, debido a que los métodos numéricos dan 
sólo una aproximación. En realidad fuimos afortunados en este caso porque teníamos la solución 
analítica que nos permitía calcular el error en forma exacta. Pero en muchos problemas de aplicación 
en ingeniería no es posible obtener la solución analítica; por lo tanto, no se pueden calcular con 
exactitud los errores en nuestros métodos numéricos. En tales casos debemos usar aproximaciones 
o estimaciones de los errores. 

Tales errores son característicos de la mayoría de las técnicas descritas en este libro. En prime- 
ra instancia, esto puede parecer contradictorio, ya que no coincide con la imagen que se tiene de una 
buena ingeniería. Los estudiantes y los practicantes de la ingeniería trabajan constantemente para 
limitar este tipo de errores en sus actividades. Cuando hacen un examen o realizan sus tareas, son 
sancionados, mas no premiados por sus errores. En la práctica profesional, los errores llegan a re- 
sultar costosos y, en algunas ocasiones, catastróficos. Si una estructura o un dispositivo falla, esto 
puede costar vidas. 

Aunque la perfección es una meta digna de alabarse, es difícil, si no imposible, alcanzarla. Por 
ejemplo, a pesar de que el modelo obtenido mediante la segunda ley de Newton es una aproximación 
excelente, en la práctica jamás predecirá con exactitud la caída del paracaidista. Fenómenos como la 
velocidad del viento y alguna ligera variación de la resistencia del aire desviarían la predicción. Si 
tales desviaciones son sistemáticamente grandes o pequeñas, habría entonces que formular un nuevo 
modelo. No obstante, si su distribución es aleatoria y se agrupan muy cerca de la predicción, entonces 
las desviaciones se considerarían insignificantes y el modelo parecerá adecuado. Las aproximaciones 
numéricas también presentan discrepancias similares en el análisis. De nuevo, las preguntas son: ¿qué 
tanto error se presenta en los cálculos?, y ¿es tolerable? 

Este capítulo y el siguiente cubren aspectos básicos relacionados con la identificación, cuanti- 
ficación y minimización de dichos errores. En las primeras secciones se revisa la información refe- 
rente a la cuantificación de los errores. En seguida, se estudia uno de los dos errores numéricos más 
comunes: errores de redondeo. Los errores de redondeo se deben a que la computadora tan sólo 
representa cantidades con un número finito de dígitos. En el siguiente capítulo nos ocuparemos de 
otra clase importante de error: el de truncamiento. El error de truncamiento es la discrepancia que 
se introduce por el hecho de que los métodos numéricos pueden emplear aproximaciones para re- 
presentar operaciones y cantidades matemáticas exactas. Por último, se analizan los errores que no 
están relacionados directamente con el método numérico en sí. Éstos son equivocaciones, errores de 
formulación o del modelo, y la incertidumbre en la obtención de los datos. 
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Capítulo 3 Aproximaciones y errores de redondeo 


3.1 CIFRAS SIGNIFICATIVAS 


En esta obra se trata de manera extensa con aproximaciones que se relacionan con el manejo de 
números. En consecuencia, antes de analizar los errores asociados con los métodos numéricos, es 
útil repasar algunos conceptos básicos referentes a la representación aproximada de los números 
mismos. 

Cuando se emplea un número para realizar un cálculo, debe haber seguridad de que pueda 
usarse con confianza. Por ejemplo, la figura 3.1 muestra un velocímetro y un odómetro (contador de 
kilometraje) de un automóvil. Con un simple vistazo al velocímetro se observa que el vehículo via- 
ja a una velocidad comprendida entre 48 y 49 km/h. Como la aguja está más allá de la mitad entre 
las marcas del indicador, es posible asegurar que el automóvil viaja aproximadamente a 49 km/h. 
Tenemos confianza en este resultado, ya que dos o más individuos que hicieran esta lectura llegarían 
a la misma conclusión. Sin embargo, supongamos que se desea obtener una cifra decimal en la esti- 
mación de la velocidad. En tal caso, alguien podría decir 48.8, mientras que otra persona podría 
decir 48.9 km/h. Por lo tanto, debido a los límites del instrumento, únicamente se emplean con 
confianza los dos primeros dígitos. Para estimaciones del tercer dígito (o más allá) sólo se conside- 
rarían aproximaciones. Sería ridículo afirmar, considerando el velocímetro de la figura, que el au- 
tomóvil viaja a 48.8642138 km/h. En contraste, el odómetro muestra hasta seis dígitos confiables. 
De la figura 3.1 se concluye que el automóvil ha recorrido un poco menos de 87 324.5 km durante 
su uso. Aquí el séptimo dígito (y los siguientes) resultan inciertos. 

El concepto de cifras o dígitos significativos se ha desarrollado para designar formalmente la 
confiabilidad de un valor numérico. Las cifras significativas de un número son aquellas que pueden 
utilizarse en forma confiable. Se trata del número de dígitos que se ofrecen con certeza, más uno 
estimado. Por ejemplo, el velocímetro y el odómetro de la figura 3.1 muestran lecturas de hasta tres 
y siete cifras significativas, respectivamente. Para el velocímetro, los dos dígitos seguros son 48. 
Por convención se ajusta el dígito estimado a la mitad de la división de la escala menor en el instru- 
mento de medición. Así, la lectura del velocímetro consistirá de las tres cifras significativas: 48.5. 
En forma similar, el odómetro dará una lectura con siete cifras significativas, 87 324.45. 

Aunque, por lo común, determinar las cifras significativas de un número es un procedimiento 
sencillo, en algunos casos genera cierta confusión. Por ejemplo, los ceros no siempre son cifras 
significativas, ya que pueden usarse sólo para ubicar el punto decimal: los números 0.00001845, 
0.0001845 y 0.001845 tienen cuatro cifras significativas. Asimismo, cuando se incluye ceros en 
números muy grandes, no queda claro cuántos son significativos. Por ejemplo, el número 45300 
puede tener tres, cuatro o cinco dígitos significativos, dependiendo de si los ceros se conocen o no 
con exactitud. La incertidumbre se puede eliminar utilizando la notación científica, donde 4.53 x 
10*, 4.530 x 10*, 4.5300 x 10* muestran, respectivamente, que el número tiene tres, cuatro y cinco 
cifras significativas. 

El concepto de cifras significativas tiene dos implicaciones importantes en el estudio de los 
métodos numéricos. 


1. Como se mencionó en el problema de la caída del para- 
caidista, los métodos numéricos dan resultados aproxi- 
mados. Por lo tanto, se deben desarrollar criterios para 
especificar qué tan confiables son dichos resultados. Una 
manera de hacerlo es en términos de cifras significativas. 
Por ejemplo, es posible afirmar que la aproximación es 
aceptable siempre y cuando sea correcta con cuatro cifras 
significativas. 


Figura 3.1 
El velocímetro y el odómetro de un automóvil ejemplifican el 
concepto de cifras significativas. 


3.3 Definiciones de error 


2. Aunque ciertas cantidades como 7, e o /7 representan cantidades específicas, no se pueden 
expresar exactamente con un número finito de dígitos. Por ejemplo, 


TT =3.141592653589793238462643... 


hasta el infinito. Como las computadoras retienen sólo un número finito de cifras significativas, 
tales números jamás se podrán representar con exactitud. A la omisión del resto de cifras signi- 
ficativas se le conoce como error de redondeo. 


Los errores de redondeo y el uso de cifras significativas para expresar nuestra confianza en un 
resultado numérico se estudiarán con mayor detalle en las siguientes secciones. Además, el concep- 
to de cifras significativas tendrá mucha importancia en la definición de exactitud y de precisión en 
la siguiente sección. 


3.2 EXACTITUD Y PRECISIÓN 


Los errores asociados con cálculos y medidas se pueden caracterizar con respecto a su exactitud y 
su precisión. La exactitud se refiere a qué tan cercano está el valor calculado o medido del valor 
verdadero. La precisión se refiere a qué tan cercanos se encuentran, unos de otros, diversos valores 
calculados o medidos. 

Estos conceptos se ilustran gráficamente utilizando la analogía con una diana en la práctica de 
tiro. Los agujeros en cada blanco de la figura 3.2 se consideran como las predicciones con una téc- 
nica numérica; mientras que el centro del blanco representa la verdad. La inexactitud (conocida 
también como sesgo) se define como una desviación sistemática del valor verdadero. Por lo tanto, 
aunque los disparos en la figura 3.2c están más juntos que los de la figura 3.2a, los dos casos son 
igualmente inexactos, ya que ambos se centran 
en la esquina superior izquierda del blanco. La 
imprecisión (también llamada incertidumbre), Aumenta la exactitud 


por otro lado, se refiere a la magnitud en la dis- 
persión de los disparos. Por consiguiente, aunque 
las figuras 3.2b y 3.2d son igualmente exactas 
(esto es, igualmente centradas respecto al blanco), 
la última es más precisa, pues los disparos están 
agrupados en forma más compacta. 

Los métodos numéricos deben ser lo sufi- 
cientemente exactos O sin sesgo para satisfacer 
los requisitos de un problema particular de inge- 
niería. También deben ser suficientemente preci- 
sos para ser adecuados en el diseño de la 
ingeniería. En este libro se usa el término error 
para representar tanto la inexactitud como la 
imprecisión en las predicciones. Con dichos 
conceptos como antecedentes, ahora analizare- 
mos los factores que contribuyen al error en los 
cálculos numéricos. 


Aumenta la precisión 


3.3 DEFINICIONES DE ERROR 


Los errores numéricos surgen del uso de aproxi- 
maciones para representar operaciones y cantl- 
dades matemáticas exactas. Éstas incluyen los 
errores de truncamiento que resultan del empleo 
de aproximaciones como un procedimiento mate- 
mático exacto, y los errores de redondeo que se 


Figura 3.2 

Un ejemplo de puntería ilustra los conceptos de exactitud y precisión. 
a) Inexacto e impreciso; b) exacto e impreciso; c) inexacto y preciso; 
d) exacto y preciso. 
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producen cuando se usan números que tienen un límite de cifras significativas para representar 
números exactos. Para ambos tipos de errores, la relación entre el resultado exacto, o verdadero, y 
el aproximado está dada por 


Valor verdadero = valor aproximado + error (3.1) 


Reordenando la ecuación (3.1) se encuentra que el error numérico es igual a la diferencia entre el 
valor verdadero y el valor aproximado, es decir 

E, = valor verdadero — valor aproximado (3.2) 
donde E, se usa para denotar el valor exacto del error. El subíndice t indica que se trata del error 
“verdadero” (true). Como ya se mencionó brevemente, esto contrasta con los otros casos, donde se 
debe emplear una estimación “aproximada” del error. 

Una desventaja en esta definición es que no toma en consideración el orden de la magnitud del 
valor que se estima. Por ejemplo, un error de un centímetro es mucho más significativo si se está 


midiendo un remache en lugar de un puente. Una manera de tomar en cuenta las magnitudes de las 
cantidades que se evalúan consiste en normalizar el error respecto al valor verdadero, es decir 


error verdadero 


Error relativo fraccional verdadero = == 
valor verdadero 


donde, como ya se mencionó en la ecuación (3.2), error = valor verdadero — valor aproximado. El 
error relativo también se puede multiplicar por 100% para expresarlo como 


_ error verdadero 00% 


3.3 
valor verdadero 63) 


donde e, denota el error relativo porcentual verdadero. 


EJEMPLO 3.1 Cálculo de errores 


Planteamiento del problema Suponga que se tiene que medir la longitud de un puente y la de 
un remache, y se obtiene 9999 y 9 cm, respectivamente. Si los valores verdaderos son 10000 y 10 
cm, calcule a) el error verdadero y b) el error relativo porcentual verdadero en cada caso. 


Solución 
a) El error en la medición del puente es [ecuación (3.2)] 
E,=10000-9999=1cm 
y en la del remache es de 
E,=10-9=1cm 
b) El error relativo porcentual para el puente es [ecuación (3.3)] 


e,= == 100% = 0.01% 


10000 


y para el remache es de 


e,= pl 100% = 10% 
10 


Por lo tanto, aunque ambas medidas tienen un error de 1 cm, el error relativo porcentual del remache 
es mucho mayor. Se concluye entonces que se ha hecho un buen trabajo en la medición del puente; 
mientras que la estimación para el remache dejó mucho que desear. 


Observe que en las ecuaciones (3.2) y (3.3), E y e tienen un subíndice f que significa que el error 
ha sido normalizado al valor verdadero. En el ejemplo 3.1 nos proporcionan este valor. Sin embargo, 
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en las situaciones reales a veces es difícil contar con tal información. En los métodos numéricos, el 
valor verdadero sólo se conocerá cuando se tengan funciones que se resuelvan analíticamente. Éste 
comúnmente será el caso cuando se estudie el comportamiento teórico de una técnica específica para 
sistemas simples. Sin embargo, en muchas aplicaciones reales, no se conoce a priori la respuesta 
verdadera. Entonces en dichos casos, una alternativa es normalizar el error, usando la mejor estima- 
ción posible al valor verdadero; es decir, para la aproximación misma, como en 


_ error odo 100% (3.4) 
valor aproximado 


a 


donde el subíndice a significa que el error está normalizado a un valor aproximado. Observe también 
que en aplicaciones reales la ecuación (3.2) no se puede usar para calcular el término del error de la 
ecuación (3.4). Uno de los retos que enfrentan los métodos numéricos es el de determinar estima- 
ciones del error en ausencia del conocimiento de los valores verdaderos. Por ejemplo, ciertos méto- 
dos numéricos usan un método iterativo para calcular los resultados. En tales métodos se hace una 
aproximación considerando la aproximación anterior. Este proceso se efectúa varias veces, o de 
forma iterativa, para calcular en forma sucesiva, esperando cada vez mejores aproximaciones. En 
tales casos, el error a menudo se calcula como la diferencia entre la aproximación previa y la actual. 
Por lo tanto, el error relativo porcentual está dado por 


_ aproximación actual — aproximación anterior 100% 
aproximación actual 


(3.5) 


En capítulos posteriores se explicarán con detalle éste y otros métodos para expresar errores. 

Los signos de las ecuaciones (3.2) a (3.5) pueden ser positivos o negativos. Si la aproximación 
es mayor que el valor verdadero (o la aproximación previa es mayor que la aproximación actual), el 
error es negativo; si la aproximación es menor que el valor verdadero, el error es positivo. También 
en las ecuaciones (3.3) a (3.5), el denominador puede ser menor a cero, lo cual también llevaría a un 
error negativo. A menudo, cuando se realizan cálculos, no importa mucho el signo del error, sino 
más bien que su valor absoluto porcentual sea menor que una tolerancia porcentual prefijada e,. Por 
lo tanto, es útil emplear el valor absoluto de las ecuaciones (3.2) a (3.5). En tales casos, los cálculos 
se repiten hasta que 


ASA 3.6) 


Si se cumple la relación anterior, entonces se considera que el resultado obtenido está dentro del 
nivel aceptable fijado previamente e, Observe que en el resto del texto en general emplearemos 
exclusivamente valores absolutos cuando utilicemos errores relativos. 

Es conveniente también relacionar estos errores con el número de cifras significativas en la 
aproximación. Es posible demostrar (Scarborough, 1966) que si el siguiente criterio se cumple, se 
tendrá la seguridad que el resultado es correcto en al menos n cifras significativas. 


e, =(0.5x 102% (3.7) 


EJEMPLO 3.2 Estimación del error con métodos iterativos 


Planteamiento del problema En matemáticas con frecuencia las funciones se representan 
mediante series infinitas. Por ejemplo, la función exponencial se calcula usando 


2 3 q" 


a OO E (E3.2.1) 
a. al n! 


Así cuanto más términos se le agreguen a la serie, la aproximación será cada vez más una mejor 
estimación del valor verdadero de e”. La ecuación (E3.2.1) se conoce como expansión en series de 
Maclaurin. 

Empezando con el primer término e*= 1 y agregando término por término, estime el valor de e%*, 
Después de agregar cada término, calcule el error relativo porcentual verdadero y aproximado usando 
las ecuaciones (3.3) y (3.5), respectivamente. Observe que el valor verdadero es e%5 = 1.648721... 
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Agregue términos hasta que el valor absoluto del error aproximado e,, sea menor que un criterio de 
error preestablecido e, con tres cifras significativas. 


Solución En primer lugar la ecuación (3.7) se emplea para determinar el criterio de error que 
asegura que un resultado sea correcto en al menos tres cifras significativas: 


€, = (0.5 x 107)% = 0.05% 


Por lo tanto, se agregarán términos a la serie hasta que e, sea menor que este valor. 
La primera estimación es igual a la ecuación (E3.2.1) con un solo término. Entonces, la prime- 
ra estimación es igual a 1. La segunda estimación se obtiene agregando el segundo término, así: 


e=1+x 
y para x= 0.5, 
e5=1+0.5=1.5 
Esto representa el error relativo porcentual verdadero de [ecuación (3.3)] 


g, = 1:648721-15_ 100% =9.02% 


1.648721 
La ecuación (3.5) se utiliza para determinar una estimación aproximada del error, dada por: 


_15-1 


a 


€ 100% = 33.3% 


Como e, no es menor que el valor requerido e,, se deben continuar los cálculos agregando otro tér- 
mino, x?/2!, repitiendo el cálculo del error. El proceso continúa hasta que e, < €. Todos los cálculos 
se resumen de la siguiente manera: 


Así, después de usar seis tér- 


Términós Resultado €, (%) €. (%) minos, el error aproximado es 
menor que e, = 0.05%, y el 
l j 233 cálculo termina. Sin embargo, 
2 1.5 9.02 33.3 
3 1.625 144 769 observe que, ¡el resultado es 
4 1.645833333 0.175 1.27 exacto con cinco cifras signi- 
5 1.648437500 0.0172 0.158 ficativas! en vez de tres cifras 
6 1.648697917 0.00142 0.0158 significativas. Esto se debe a 


que, en este caso, las ecuacio- 
nes (3.5) y (3.7) son conserva- 


doras. Es decir, aseguran que el resultado es, por lo menos, tan bueno como lo especifican. Aunque, 
como se analiza en el capítulo 6, éste no es siempre el caso al usar la ecuación (3.5), que es verdade- 
ra en la mayoría de las veces. 


3.3.1 Algoritmo de computadora para cálculos iterativos 


Muchos de los métodos numéricos que se describen en el resto de este libro utilizan cálculos itera- 
tivos del tipo que se ilustra en el ejemplo 3.2. Todos ellos conllevan la resolución de un problema 
matemático mediante el cálculo de aproximaciones sucesivas a la solución, comenzando por una 
conjetura inicial. 

La implementación en computadora de tales soluciones iterativas incluye ciclos de computación. 
Como se vio en la sección 2.1.1, éstos vienen en dos formas básicas: ciclos controlados por cuenta y 
loops de decisión. La mayor parte de las soluciones iterativas usan ciclos de decisión. Así, en vez de 
emplear un número preespecificado de iteraciones, el proceso típicamente se repite hasta que un 
estimado aproximado de error cae por debajo de un criterio de detención, como en el ejemplo 3.2. 

En la figura 3.3 se presenta un pseudocódigo para un cálculo iterativo genérico. A la función se 
le pasa un valor (va1) junto con criterio de error de detención (es), y un valor máximo permisible 
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de iteraciones (maxit). El valor típicamente es: 1) un valor FUNCTION IterMethíval, es, maxit) 


inicial, o 2) el valor para el cual se debe hacer el cálculo ite- ¡ter = 1 
rativo. sol = val 


La función inicializa primero tres variables, que incluyen: o = 400 


1) una variable iter que lleva la cuenta del número de itera- solold = sal 


ciones, 2) una variable sol que contiene el estimado actual sol = 

de la solución y 3) una variable ea que contiene el porcentaje iter = iter+ 1 

aproximado de error relativo. Observe que ea al inicio se IF sol + 0 ea=abs((sol - solold)/sol)*100 
ajusta a un valor de 100 para asegurar que el bucle se ejecute IF ea < es OR ¡ter 2 maxit EXIT 


END DO 
IterMeth = sol 
END IterMeth 


por lo menos una vez. 

Después de estas inicializaciones sigue el bucle de decisión 
que realmente implementa el cálculo iterativo. Antes de gene- 
rar una nueva solución, sol se asigna primero a solold. Figura 3.3 
Luego se calcula un nuevo valor de sol, y se incrementa el Pseudocódigo para un cálculo genérico iterativo. 
contador de iteraciones. Si el nuevo valor de sol es diferente 
de cero, se determina el porcentaje de error relativo ea. En 
seguida se prueban los criterios de detención. Si ambos son falsos, se repite el bucle. Si cualquiera 
de ellos es verdadero, termina el bucle y se envía de regreso a la llamada de función. El siguiente 
ejemplo ilustra cómo se puede aplicar el algoritmo genérico a un cálculo iterativo específico. 


EJEMPLO 3.3 Implementación en computadora de un cálculo iterativo 


Planteamiento del problema  Desarrolle un programa de computación basado en el pseudocó- 
digo de la figura 3.3 para implementar el cálculo del ejemplo 3.2. 


Solución Una función para implementar la expansión de la serie de Maclaurin para e* se puede 
basar en el esquema general de la figura 3.3. Para hacer esto, primero se formula la expansión de la 
serie como una fórmula: 


La figura 3.4 muestra las funciones para implementar esta serie, escritas en VBA y MATLAB. Se 
podrían desarrollar códigos similares en otros lenguajes como C++ o Fortran 95. Observe que, 
mientras MATLAB tiene una función factorial interna, es necesario calcular el factorial como 
parte de la implementación en VBA con un solo acumulador de productos fac. 

Al correr los programas, generan un estimado para la función exponencial. Para la versión 
MATLAB, la respuesta se devuelve junto con el error aproximado y el número de iteraciones. Por 
ejemplo, e! se puede evaluar como 


>> format long 
>> [val, ea, iter] = IterMeth(1,1e-6,100) 


val = 
2.118281826198493 
ea = 
9.216155641522974e-007 
iter = 
12 


Se puede ver que, después de 12 iteraciones, se obtiene un resultado de 2/7182818 con un error 
aproximado de estimación = 9.2162 x 10%. El resultado se puede verificar usando la función in- 
terna exp para calcular directamente el valor exacto y el error relativo porcentual verdadero. 


>> trueval=exp (1) 


trueval = 
2.118281828459046 


49 


50 Capítulo 3 Aproximaciones y errores de redondeo 


>> et=abs((trueval-val)/trueval)*100 


et = 


8.316108397236229e-008 


Como en el caso del ejemplo 3.2, se obtuvo el resultado deseable de que el error verdadero es menor 
que el error aproximado. 


a) VBA/Excel b) MATLAB 
Function IterMeth(x, es, maxit) function [v,ea,iter] = IterMeth (x,es,maxit) 
' initialization % initialization 
iter = 1 iter = 1; 
sol = 1 sol = 1; 
ea = 100 ea = 100; 
fac = 1 
' iterative calculation % iterative calculation 
Do while (1) 
solold = sol solold = sol; 
fac = fac * iter 
sol = sol + x ” iter / fac sol = sol + x ”* iter / factorial(iter); 
iter = iter + 1 iter = iter + 1; 
If sol <> 0 Then if sol-=0 
ea = Abs((sol - solold) / sol) * 100 ea=abs( (sol - solold)/sol)*100; 
End If end 
If ea <= es Or iter >= maxit Then Exit Do if ea<=es | iter>=maxit,break,end 
Loop end 
IterMeth = sol v = sol; 
End Function end 


Figura 3.4 
a) VBA/Excel y b) Funciones MATLAB basadas en el pseudocódigo de la figura 3.3. 


Con las definiciones anteriores como antecedente, se procede ahora a examinar los dos tipos de 
error relacionados directamente con los métodos numéricos: el error de redondeo y el error de trun- 
camiento. 


3.4 ERRORES DE REDONDEO 


Como se mencionó antes, los errores de redondeo se originan debido a que la computadora emplea 
un número determinado de cifras significativas durante un cálculo. Los números como JT, e O 7 
no pueden expresarse con un número fijo de cifras significativas. Por lo tanto, no pueden ser re- 
presentados exactamente por la computadora. Además, debido a que las computadoras usan una 
representación en base 2, no pueden representar exactamente algunos números en base 10. Esta 
discrepancia por la omisión de cifras significativas se llama error de redondeo. 


3.4.1 Representación de números en la computadora 


Numéricamente los errores de redondeo se relacionan de manera directa con la forma en que se 
guardan los números en la memoria de la computadora. La unidad fundamental mediante la cual se 
representa la información se llama término. Ésta es una entidad que consiste en una cadena de dígi- 
tos binarios o bits (binary digits). Por lo común, los números son guardados en una o más términos. 
Para entender cómo se realiza esto, se debe revisar primero algún material relacionado con los sis- 
temas numéricos. 


Sistemas numéricos Un sistema numérico es simplemente una convención para representar 
cantidades. Debido a que se tienen 10 dedos en las manos y 10 dedos en los pies, el sistema de nu- 
meración que nos es muy familiar es el decimal o de base 10. Una base es el número que se usa como 
referencia para construir un sistema. El sistema de base 10 utiliza 10 dígitos (0, 1, 2, 3, 4, 5, 6, 7, 8, 
9) para representar números. Tales dígitos son satisfactorios por sí mismos para contar de O a 9. 


3.4 Errores de redondeo 


Para grandes cantidades se usa la combinación de estos dígitos básicos; con la posición o valor 
de posición se especifica su magnitud. El dígito en el extremo derecho de un número entero repre- 
senta un número del 0 al 9. El segundo dígito a partir de la derecha representa un múltiplo de 10. El 
tercer dígito a partir de la derecha representa un múltiplo de 100 y así sucesivamente. Por ejemplo, 
si se tiene el número 86 409 se tienen 8 grupos de 10000, seis grupos de 1000, cuatro grupos de 100 
y cero grupos de 10, y nueve unidades, o bien 


(8 x 10% + (6 x 107) + (4 x 102) + (0x 101) + (9 x 10%) = 86409 


La figura 3.5a ofrece una representación de cómo se MAA 
formula un número en el sistema de base 10. Este tipo de re- % A "y An A 
presentación se llama notación posicional. A 


Debido a que el sistema decimal resulta ser tan familiar, N 
no es común darse cuenta de que existen otras alternativas. O 


Por ejemplo, si el ser humano tuviera ocho dedos en las manos 
y ocho en los pies, se tendría, sin duda, una representación en 
un sistema octal o de base 8. En tal sentido nuestra amiga la 
computadora es como un animal que tiene dos dedos, limita- 
do a dos estados: 0 o 1. Esto se relaciona con el hecho de que 
las unidades lógicas fundamentales de las computadoras di- 
gitales sean componentes electrónicos de apagado/encendido. DOI IL 
Por lo tanto, los números en la computadora se representan A 100 109001 150 

con un sistema binario o de base 2. Del mismo modo que con LS A DM E. 


a) 


el sistema decimal, las cantidades pueden representarse usan- SE 


do la notación posicional. Por ejemplo, el número binario 11 
es equivalente a (1x 25) + (1x2) =2 + 1 =3 en el sistema 
decimal. En la figura 3.5b se ilustra un ejemplo más complejo. 


Representación entera Ahora que se ha revisado cómo los b) 
números de base 10 se representan en forma binaria, es fácil 

concebir cómo los enteros se representan en la computadora. 

El método más sencillo se denomina método de magnitud con 

signo y emplea el primer bit de un término para indicar el Figura 3.5 
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9x l= 2) 
Ox 10 = 0 


4x  100= 400 
6x 1000= 6000 
8 Xx 10000 = 80 000 


86 409 
1x Sl 
0% 2= 1 
1% ¿d¿= e 
1x 8= 8 
0x l6= 0 
15 ¿=> El 
0x 64= 0 
1 x 128 = 128 

173 


signo: con un O para positivo y un 1 para el negativo. Los bits Cómo trabajan los sistemas a) decimal (base 10) y b) binario 
sobrantes se usan para guardar el número. Por ejemplo, el (base 2). En b) el número binario 10101101 es equivalente al 


valor entero -173 puede guardarse en la memoria de una número decimal 173. 
computadora de 16 bits como se muestra en la figura 3.6. 


Figura 3.6 
A AAA | e | OA 0 La representación de un entero decimal -173 en una compu- 
; s y -  tadora de 16 bits usando el método de magnitud con signo. 
Número 


Signo 


EJEMPLO 3.4 Rango de enteros 


Planteamiento del problema Determine el rango de enteros de base 10 que pueda represen- 
tarse en una computadora de 16 bits. 


Solución Delos 16 bits, se tiene el primer bit para el signo. Los 15 bits restantes pueden contener 
los números binarios de O a 111111111111111. El límite superior se convierte en un entero decimal, 
así 


(1x219+ (1x2) ++ (125 +(1x20) 


que es igual a 32767 (observe que esta expresión puede simplemente evaluarse como 21% — 1). Así, 
en una computadora de 16 bits un término puede guardar en memoria un entero decimal en el rango 
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de -32767 a 32767. Además, debido a que el cero está ya definido como 0000000000000000, sería 
redundante usar el número 1000000000000000 para definir “menos cero”. Por lo tanto, es usual- 
mente empleado para representar un número negativo adicional: 32768, y el rango va de -32768 a 
32767. 


Observe que el método de magnitud con signo descrito antes no se utiliza para representar en- 
teros en computadoras convencionales. Se prefiere usar una técnica llamada complemento de 2 que 
incorpora en forma directa el signo dentro de la magnitud del número, en lugar de emplear un bit 
adicional para representar más o menos (véase Chapra y Canale, 1994). Sin embargo, el ejemplo 3.4 
sigue sirviendo para ilustrar cómo todas las computadoras digitales están limitadas en cuanto a su 
capacidad para representar enteros. Esto es, los números por encima o por debajo de este rango no 
pueden representarse. Una limitación más importante se encuentra en el almacenaje y la manipula- 
ción de cantidades fraccionarias, como se describe a continuación. 


Representación del punto flotante Las cantidades fraccionarias generalmente se representan 
en la computadora usando la forma de punto flotante. Con este método, el número se expresa como 
una parte fraccionaria, llamada mantisa o significando, y una parte entera, denominada exponente 
o característica, esto es, 


m -b* 


donde m = la mantisa, b = la base del sistema numérico que se va a utilizar y e = el exponente. Por 
ejemplo, el número 156.78 se representa como 0.15678 x 10* en un sistema de base 10 de punto 
flotante. 

En la figura 3.7 se muestra una forma en que el número de punto flotante se guarda en una 
palabra. El primer bit se reserva para el signo; la siguiente serie de bits, para el exponente con signo; 
y los últimos bits, para la mantisa. 


Exponente 
con signo | 
o Mantisa a Figura 3.7 
La forma en que un número de punto flotante se guarda 


| en un término. 
Signo 


Observe que la mantisa es usualmente normalizada si tiene primero cero dígitos. Por ejemplo, 
suponga que la cantidad 1/34 = 0.029411765... se guarda en un sistema de base 10 con punto flotan- 
te, que únicamente permite guardar cuatro lugares decimales. Entonces, 1/34 se guardaría como 


0.0294 x 100 


Sin embargo, al hacerlo así, la inclusión del cero “inútil” a la derecha del punto decimal nos obliga a 
eliminar el dígito 1 del quinto lugar decimal. El número puede normalizarse para eliminar el cero 
multiplicando la mantisa por 10 y disminuyendo el exponente en 1, para quedar 


0,2941 x 107! 


Así, se conserva una cifra significativa adicional al guardar el número. 
La consecuencia de la normalización es que el valor absoluto de m queda limitado. Esto es, 


1 
—<m<l 3.8 
» (3.8) 


donde b = la base. Por ejemplo, para un sistema de base 10, m estaría entre 0.1 y 1; y para un sistema 
de base 2, entre 0.5 y 1. 

La representación de punto flotante permite que tanto fracciones como números muy grandes 
se expresen en la computadora. Sin embargo, hay algunas desventajas. Por ejemplo, los números de 
punto flotante requieren más espacio y más tiempo de procesado que los números enteros. Más im- 


3.4 Errores de redondeo 


portante aún es que su uso introduce una fuente de error debido a que la mantisa conserva sólo un 
número finito de cifras significativas. Por lo tanto, se introduce un error de redondeo. 


EJEMPLO 3.5 Conjunto hipotético de números con punto flotante 


Planteamiento del problema Determine un conjunto hipotético de números con punto flotan- 
te para una máquina que guarda información usando términos de 7 bits. Emplee el primer bit para 
el signo del número, los siguientes tres para el signo y la magnitud del exponente, y los últimos tres 
para la magnitud de la mantisa (véase figura 3.8). 


Solución El número positivo más pequeño posible se 91 90 9192 93 
representa en la figura 3.8. El O inicial señala que la canti- 
dad es positiva. El 1 en el segundo lugar indica que el ex- 


o|1[1 [1 1 pp po 


ponente tiene signo negativo. Los 1, en el tercero y cuarto e | A Maghi lud Í 
lugar dan un valor máximo al exponente de Signo del Signo del de la mantisó 
i E número exponente 

1x2'+1x2"=3 Magnitud 

Por lo tanto, el exponente será —3. Por último, la mantisa del exponente 

está especificada por el 100 en los últimos tres lugares, lo Figura 3.8 

cual nos da El número positivo de punto flotante 
1x2 1+0x22+0x23=0.5 más pequeño posible del ejemplo 3.5. 


Aunque es posible tomar una mantisa más pequeña (por 

ejemplo, 000, 001, 010, 011), se emplea el valor de 100 

debido al límite impuesto por la normalización [ecuación (3.8)]. Así, el número positivo más peque- 
ño posible en este sistema es +0.5 x 27, el cual es igual a 0.0625 en el sistema de base 10. Los si- 
guientes números más grandes se desarrollan incrementando la mantisa como sigue: 


0111101=(1x21+0x2?+1x27)x 27 =(0.078125),0 
0111110=(1x21+1x22+0x23)x 27 = (0.093750),0 
0111111=(1x21+1x22+1x23) x 27 =(0.109375),0 


Observe que las equivalencias de base 10 se esparcen de manera uniforme en un intervalo de 0.015625. 
En este punto, para continuar el incremento se debe disminuir el exponente a 10, lo cual da un valor de 


1x21+0x2=2 
La mantisa disminuye hasta su valor más pequeño: 100. Por lo tanto, el siguiente número es 
0110100 = (1x2 +0x2?+0x23) x 2? = (0,125000) 10 
Esto todavía representa una brecha o espacio de 0.125000 — 0.109375 = 0.015625. Sin embargo, 
cuando los números grandes se generan incrementando la mantisa, la brecha es de 0.03125, 
0110101 = (1x2 +0x2?+1x23) x 2? = (0,156250) ¡0 
0110110=(1x2+1x2?*+0x23) x 2? = (0.187500) 10 
0110111 =(1x2!+1x22+ 1x2) x 2? = (0.218750);0 
Este patrón se repite conforme se formula una cantidad mayor hasta que se alcanza un número má- 
ximo: 


0011111=(1x21+1x22+1x23)x23=(7),0 


El conjunto del número final se muestra en la figura 3.9. 


En la figura 3.9 se presentan diversos aspectos de la representación de punto flotante, que son 
importantes respecto de los errores de redondeo en las computadoras. 
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Corte Redondeo 


x-Ax Da leal x+ Ax 


y  "N 7 
Gimp A Oval —+ 


Figura 3.9 

Sistema numérico hipotético desarrollado en el 
ejemplo 3.5. Cada valor se indica con una marca. 
Tan sólo se muestran los números positivos. Un con- 


Underflow “agujero” junto idéntico se extendería en dirección negativa. 
en el cero 
1. El rango de cantidades que pueden representarse es limitado. Como en el caso de los enteros, hay 


números grandes positivos y negativos que no pueden representarse. Intentar emplear números 
fuera del rango aceptable dará como resultado el llamado error de desbordamiento (overflow). Sin 
embargo, además de las grandes cantidades, la representación de punto flotante tiene la limitación 
adicional de que números muy pequeños no pueden representarse. Esto se ilustra por el “agujero” 
underflow entre el cero y el primer número positivo en la figura 3.9. Se debe observar que este 
agujero aumenta por las limitaciones de normalización de la ecuación (3.8). 

Existe sólo un número finito de cantidades que puede representarse dentro de un rango. Así, el 
grado de precisión es limitado. Es evidente que los números irracionales no pueden representarse 
de manera exacta. Además, los números racionales que no concuerdan exactamente con uno de 
los valores en el conjunto tampoco pueden ser representados en forma precisa. A los errores 
ocasionados por la aproximación en ambos casos se les conoce como errores de cuantificación. 
La aproximación real se realiza por dos caminos: cortando o redondeando. Por ejemplo, suponga 
que el valor de 1 =3.14159265358... se va a guardar en un sistema de numeración de base 10 
con 7 cifras significativas. Un método de aproximación podría ser simplemente omitir, o “cortar”, 
el octavo y demás términos, como en 7 = 3.141592, con la introducción de un error asociado de 
[ecuación (3.2)] 


E, = 0.00000065... 


Esta técnica de mantener sólo términos significativos fue originalmente conocida como “trun- 
camiento” en la jerga computacional. Preferimos llamarla corte para distinguirla de los errores 
de truncamiento que se analizarán en el capítulo 4. Observe que en el sistema numérico de base 
2 de la figura 3.9, corte significa que cualquier cantidad que esté dentro de un intervalo de lon- 
gitud Ax se guardará en memoria como una cantidad en el extremo inferior del intervalo. Así, el 
error máximo por corte es Ax. Además, se presenta un sesgo porque todos los errores son posi- 
tivos. La deficiencia del corte se atribuye al hecho de que los términos superiores de la repre- 
sentación decimal completa no tienen impacto en la versión cortada. Así, en el ejemplo de zz, el 
primer dígito descartado es 6. El último dígito retenido debería redondearse a 3.141593. Tal 
redondeo reduce el error a 


E, = -0.00000035... 


En consecuencia, el redondeo produce un error absoluto menor que el de corte. Observe que, en 
el sistema numérico de base 2 de la figura 3.9, redondear significa que cualquier cantidad que 
esté en un intervalo de longitud Ax se representará como el número más cercano permitido. 


3.4 Errores de redondeo 


Entonces, el error máximo de redondeo es Ax/2. Además, no se presenta sesgo porque ciertos 
errores son positivos y otros son negativos. Algunas computadoras emplean redondeo. Sin em- 
bargo, esto aumenta el trabajo computacional y, en consecuencia, muchas máquinas simplemente 
usan el corte. Dicho enfoque se justifica con la suposición de que el número de cifras signifi- 
cativas es suficientemente grande para que los errores de redondeo resultantes sean despreciables. 
3. El intervalo entre los números, Ax, aumenta conforme los números crecen en magnitud. Ésta es 
la característica, por supuesto, que permite que la representación de punto flotante conserve los 
dígitos significativos. Sin embargo, también quiere decir que los errores de cuantificación sean 
proporcionales a la magnitud del número que será representado. Para normalizar los números de 
punto flotante, esta proporcionalidad se expresa, para los casos en que se emplea el corte, como 


<e (3.9) 


y, para los casos donde se utiliza el redondeo, como 


[Ax] < Kg (3.10) 
br] 2 
donde a 8 se le denomina épsilon de la máquina, el cual se calcula como 
8 = pi (36.10 


donde b es el número base y 1 es el número de dígitos significativos en la mantisa. Observe que 
las desigualdades en las ecuaciones (3.9) y (3.10) quieren decir que éstos son los límites de los 
errores. Es decir, especifican los casos extremos. 


EJEMPLO 3.6  Épsilon de la máquina 


Planteamiento del problema Determine el épsilon de la máquina y verifique su efectividad 
para caracterizar los errores del sistema numérico del ejemplo 3.5. Suponga que se usa al corte. 


Solución El sistema de punto flotante hipotético del ejemplo 3.5 empleaba valores de base b= 2, 
y número de bits de la mantisa £ = 3. Por lo tanto, el épsilon de la máquina debe ser [ecuación (3.11)] 


€ =213=0,25 


AAA mL Figura 3.10 


El error de cuantificación más grande 
ocurrirá para aquellos valores que 
Error relativo caigan justo debajo del límite superior 
mayor del primero de una serie de intervalos 
equiespaciados. 


En consecuencia, el error de cuantificación relativo estará limitado por 0.25, para el corte. El error 
relativo más grande debería ocurrir para aquellas cantidades que caen justo debajo del límite superior 
del primer intervalo entre números equidistantes sucesivos (véase figura 3.10). Aquellos números 
que caen en los intervalos sucesivos siguientes tendrán el mismo valor de Ax pero un mayor valor de 
x y, por lo tanto, tendrán un error relativo bajo. Un ejemplo de un error máximo sería un valor que 
cae justo por debajo de límite superior del intervalo entre (0.125000),, y (0.156250);¿. Para este caso, 
el error sería menor a 


0.03125 — 
0.125000 


Entonces, el error es como se predijo mediante la ecuación (3.9). 
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epsilon = 1 
DO 
IF (epsilon+1 < 


1) EXIT 
epsilon = epsilon/2 


Capítulo 3 Aproximaciones y errores de redondeo 


El hecho de que los errores de cuantificación dependan de la magnitud tiene varias aplicaciones 
prácticas en los métodos numéricos. Muchas de ellas están relacionadas con la comúnmente emplea- 
da operación de probar si dos números son iguales. Ello ocurre cuando se prueba la convergencia de 
cantidades, así como en los mecanismos para detener procesos iterativos (véase el ejemplo 3.2). En 
estos casos deberá ser claro que más que probar si las dos cantidades son iguales, es recomendable 
probar si su diferencia es menor que una pequeña tolerancia aceptable. Además, deberá ser evidente 
que más que la diferencia absoluta, deberá compararse la diferencia normalizada, en especial cuan- 
do se trabaja con números de gran magnitud. El épsilon de la máquina, además, se emplea al formu- 
lar criterios de paro o de convergencia. Esto asegura que los programas sean portátiles, 
es decir, que no sean dependientes de la computadora sobre la cual se hayan implemen- 
tado. En la figura 3.11 se presenta un pseudocódigo que automáticamente determina el 
épsilon de la máquina en una computadora binaria. 


ea E n= 2 x epsilon Precisión extendida Aquí se debe observar que, aunque los errores de redondeo llegan 

a ser importantes en contextos como pruebas de convergencia, el número de dígitos signi- 
Figura 3.11 ficativos que tiene la mayoría de las computadoras permite que muchos cálculos de inge- 
Pseudocódigo para determinar el niería se realicen con una precisión más que aceptable. Por ejemplo, el sistema numérico 
épsilon de la máquina en una hipotético de la figura 3.9 es una enorme exageración que se usó con propósitos ilustrativos. 


computadora binaria. 


En las computadoras comerciales se utilizan conjuntos mucho más grandes y por consi- 

guiente se permite que los números queden expresados con una precisión adecuada. Por 

ejemplo, las computadoras que usan el formato IEEE permiten 24 bits para ser usados por 
la mantisa, lo cual se traduce en cerca de siete cifras significativas de precisión! en dígitos de base 10 
con un rango aproximado de 10% a 107, 

Se debe reconocer que aún hay casos donde el error de redondeo resulta crítico. Por tal razón 
muchas computadoras permiten la especificación de precisión extendida. La más común de estas 
especificaciones es la doble precisión, en la cual se duplica el número de términos utilizado para 
guardar números de punto flotante. Esto proporciona de 15 a 16 dígitos decimales de precisión y un 
rango aproximado de 10739 a 1038, 

En muchos casos el uso de cantidades de doble precisión llega a reducir, en gran medida, el 
efecto del error de redondeo. Sin embargo, el precio que se paga por tales medidas remediales con- 
siste en mayores requerimientos de memoria y de tiempo de ejecución. La diferencia en el tiempo 
de ejecución de un cálculo pequeño podría parecer insignificante. No obstante, conforme los pro- 
gramas van siendo cada vez más grandes y complicados, el tiempo de ejecución agregado se vuelve 
más considerable y repercute de manera negativa para resolver el problema en forma efectiva. Por lo 
tanto, la precisión extendida no debería utilizarse en forma generalizada. Por el contrario, deberá ser 
empleada en forma selectiva, donde se obtenga un máximo beneficio al menor costo en términos de 
tiempo de ejecución. En las siguientes secciones veremos más de cerca cómo los errores de redondeo 
afectan los cálculos y ello nos servirá para comprender los fundamentos que nos guíen en el uso de 
la capacidad de la doble precisión. 

Antes de proseguir, debemos observar que algunos paquetes de software de uso común (por 
ejemplo, Excel o Mathcad) normalmente utilizan doble precisión para representar las cantidades 
numéricas. Así, quienes desarrollaron estos paquetes decidieron reducir los errores de redondeo 
sacrificando velocidad para usar una precisión extendida. Otros, como el MATLAB, permiten usar 
la precisión extendida, si se desea. 


3.4.2 Manipulación aritmética de números en la computadora 


Junto con las limitaciones del sistema numérico de una computadora, las manipulaciones aritméticas 
que se usan con tales números también pueden dar como resultado errores de redondeo. En la si- 
guiente sección se ilustrará primero cómo afectan las operaciones aritméticas comunes a los errores 


| Observe que, de hecho, únicamente 23 bits se emplean en la memoria para la mantisa. Sin embargo, debido a la normalización, 
el primer bit de la mantisa es siempre 1 y, por lo tanto, no se guarda. Así, el primer bit junto con los 23 bits de memoria dan 
24 bits en total para la precisión de la mantisa. 


3.4 Errores de redondeo 


de redondeo. De este modo, investigaremos varias manipulaciones que son especialmente propensas 
a errores de redondeo. 


Operaciones aritméticas comunes A causa de que estamos familiarizados con los números 
de base 10, los emplearemos para ilustrar el efecto del error de redondeo en las operaciones básicas: 
suma, resta, multiplicación y división. Otras bases de números pueden tener un comportamiento 
similar. Para simplificar el análisis, emplearemos una computadora decimal hipotética con una 
mantisa de 4 dígitos y un exponente de 1 dígito. Además, se usará el corte. El redondeo puede im- 
plicar errores similares, aunque menos dramáticos. 

Cuando se suman dos números de punto flotante, el número de la mantisa con el exponente 
menor se modifica de tal forma que los exponentes sean los mismos. Esto tiene el efecto de alinear 
los puntos decimales. Por ejemplo, suponga que se quiere sumar 0,1557 - 10! + 0,4381 - 1071, El de- 
cimal de la mantisa del segundo número se recorre a la izquierda un número de lugares igual a la 
diferencia de los exponentes [1 — (21) = 2], así, 


0.4381 - 107! > 0.004381 - 10! 


Ahora se suman los números, 


0.1557  -10! 
0.004381 - 10' 
0.160081 - 10! 


y el resultado es cortado a 0.1600 - 10!, Note cómo los últimos dos dígitos del segundo número que 
se recorrieron a la derecha fueron eliminados de los cálculos. 

La resta se realiza en forma idéntica a la suma, con la excepción del signo del sustraendo, que 
es negativo. Por ejemplo, suponga que hacemos la resta 36.41 menos 26.86. Esto es, 


0.3641 - 10? 
- 0.2686 - 10? 
0.0955 - 10? 


Aquí el resultado no está normalizado y se debe recorrer el decimal un lugar a la derecha para 
obtener 0.9550 - 10! = 9,550. Observe que el cero sumado al final de la mantisa no es relevante, tan 
sólo llena el espacio vacío creado al recorrer los números. Es posible obtener resultados más dramá- 
ticos todavía, cuando las cantidades estén muy cercanas, como por ejemplo, 


0.7642 - 10% 
- 0.7641 - 10% 
0.0001 - 10% 


que podría convertirse en 0.1000 - 10% = 0.1000. Así, en este caso, se agregan tres ceros no signifi- 
cativos, lo cual introduce un error sustancial de cálculo debido a que las manipulaciones siguientes 
actúan como si los ceros fueran significativos. Como se verá más adelante en otra sección, la pérdi- 
da significativa durante la resta de números casi iguales es una de las principales fuentes de errores 
de redondeo en los métodos numéricos. 

La multiplicación y la división resultan un poco más sencillos que la suma y la resta. Los expo- 
nentes se suman y la mantisa se multiplica. Debido a que la multiplicación de dos mantisas de n 
dígitos da como resultado 2n dígitos, muchas computadoras ofrecen resultados intermedios en un 
registro de doble longitud. Por ejemplo, 


0.1363 - 10% x 0.6423 - 10! = 0.08754549 - 10? 
Si, como en este caso, se introduce un cero, el resultado es normalizado, 
0.08754549 - 10? > 0.8754549 - 10! 


y cortando resulta 


0.8754 - 10! 
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La división se realiza en forma similar, aunque las mantisas se dividen y los exponentes se res- 
tan. Entonces el resultado es normalizado y cortado. 


Cálculos grandes Ciertos métodos requieren un número extremadamente grande de manipula- 
ciones aritméticas para llegar a los resultados finales. Además, dichos cálculos a menudo son inter- 
dependientes; es decir, los cálculos son dependientes de los resultados previos. En consecuencia, 
aunque el error de redondeo individual sea pequeño, el efecto acumulativo durante el proceso de 
muchos cálculos puede ser relevante. 


EJEMPLO 3.7 Un número grande de cálculos interdependientes 


ROGRAM f190312 Planteamiento del problema Investigue el efecto del 
PLICIT none error de redondeo en un gran número de cálculos interde- 
TEGER:: 5 pendientes. Desarrolle un programa que sume un número 

EAL::suml, sum2, xl, x2 100000 veces. Sume el número 1 con precisión simple, y 

OUBLE PRECISION: :sum3, x3 0.00001 con precisiones simple y doble. 


m2=0. Solución En la figura 3.12 se muestra un programa en 


ri =0 Fortran 90 que realiza la suma. Mientras que la suma con 
d=1 " se precisión simple de 1 dará el resultado esperado, la precisión 
3=1.d-5 simple en la suma de 0.00001 tiene una gran discrepancia. 
O i=1, 100000 Este error se reduce de manera importante cuando 0.00001 
suml=suml+x1 se suma con precisión doble. 
sum2=sum2+x2 Los errores de cuantificación son la fuente de las discre- 
sum3=sum3+x3 pancias. Debido a que el entero 1 puede ser representado en 
. Je 2D de el forma exacta en la computadora, puede sumarse exactamen- 
PRINT * Stma te. En contraste, 0.00001 no puede representarse con exacti- 
PRINT *, sum3 tud y se cuantifica con un valor que es ligeramente diferente 
END de su valor verdadero. Aunque esta ligera discrepancia resul- 
output: tará insignificante para un cálculo pequeño, se acumula 
100000.000000 después de la repetición de sumas. Tal problema ocurre tam- 
1.000990 bién con la precisión doble, pero se reduce en forma relevan- 
9.999999999980838E-001 te porque el error de cuantificación es mucho más pequeño. 


Figura 3.12 
Programa en Fortran 90 para sumar un número 10* veces. Aquí se suma el número 1 
con precisión simple y el número 10” con precisiones simple y doble. 


Observe que el tipo de error ilustrado en el ejemplo anterior es algo atípico porque todos los 
errores en las operaciones que se repiten tienen el mismo signo. En muchos casos, los errores en 
grandes cálculos alternan el signo de manera aleatoria y, entonces, con frecuencia se cancelan. Sin 
embargo, hay también algunos casos donde tales errores no se cancelan pero, en efecto, llevan a 
resultados finales dudosos. En las siguientes secciones se mostrará cómo puede ocurrir esto. 


Suma de un número grande y uno pequeño Suponga que se desea sumar un número pe- 
queño, 0.0010, con un número grande, 4000, utilizando una computadora hipotética con una man- 
tisa de 4 dígitos y un exponente de 1 dígito. Modificamos el número pequeño para que su 
exponente sea igual al del grande, 


0.4000  -10* 
0.0000001 - 10* 
0.4000001 - 10* 


el cual se corta a 0.4000 - 10*, Así, ¡resultó lo mismo que si no hubiéramos realizado la suma! 


3.4 Errores de redondeo 


Este tipo de error puede ocurrir cuando se calculan series infinitas. Por ejemplo, si el término 
inicial de una serie es relativamente grande en comparación con los demás términos, después de que 
se han sumado unos pocos términos, estamos en la situación de sumar una cantidad pequeña a una 
cantidad grande. 

Una manera de reducir este tipo de errores consiste en sumar la serie en sentido inverso: esto 
es, en orden ascendente en lugar de descendente. De esta manera, cada nuevo término será compa- 
rable en magnitud con el de la suma acumulada (véase el problema 3.5). 


Cancelación por resta Se refiere al redondeo inducido cuando se restan dos números de punto 
flotante casi iguales. 

Un caso común donde esto ocurre es en la determinación de las raíces de una ecuación cuadrá- 
tica o parábola utilizando la fórmula cuadrática, 


Xx —bixvb?-—4ac 
aca A a (3.12) 
Xx, 2a 
En los casos donde b? > 4ac, la diferencia en el numerador puede ser muy pequeña. En tales casos, 
la precisión doble llega a reducir el problema. Además, una formulación alternativa puede usarse 
para minimizar la cancelación por resta. 


Xx; —2c 


xa  bixlb?—4ac 


Una ilustración del problema y del uso de esta fórmula alternativa se ofrecen en el siguiente ejemplo. 


(3.13) 


Option Explicit "Display results 
Sheets ("sheet1") .Select 
Sub fig0313() Range ("b2") .Select 
Dim a As Single, b As Single ActiveCell.Value = xl 
Dim c As Single, d As Single ActiveCell.Offset (1, 0) .Select 
Dim x1 As Single, x2 As Single ActiveCell.Value = x2 
Dim x1lr As Single ActiveCell.Offset(2, 0) .Select 
Dim aa As Double, bb As Double ActiveCell.Value = x11 
Dim cc As Double, dd As Double ActiveCell.Offset (1, 0) .Select 
Dim x11 As Double, x22 As Double ActiveCell.Value = x22 
ActiveCel1l.Offset(2, 0) .Select 
'Single precision: ActiveCell.Value = xlr 
a= 1: b = 3000.001: c = 3 End Sub 


d = Saríb*b-4*a*c) 
x1= (b+d)/ (2 * a) 
x2= (b-d)/ (2* a) 


O 


UTPUT: 


"Double precision: 
aa = 1: bb = 3000.001: cc = 3 A | B E 


1 |Single-precision results: 
o e O A E -0.000976563 
x11 = (bb + dd) / (2 * aa) 312 -3000.00000000 
x22 = (-bb - dd) / (2 * aa) 4 [Double-precision results: 
5 |x1 -0.00100000 
'Modified formula for first root 6 1x2 -3000.00000000 
"single precision: 7 |Modified formula for first root (single precision) 
28 (x1 -0.00100000 


xlr=-2*cCcJ/ (b + ad) 


Figura 3.13 
Programa Excel/VBA para determinar las raíces de una cuadrática. 
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Capítulo 3 Aproximaciones y errores de redondeo 


EJEMPLO 3.8 Cancelación por resta 


Planteamiento del problema Calcule el valor de las raíces de una ecuación cuadrática con a= l, 
b=3000.001 y c =3. Compare el valor calculado con las raíces verdaderas x, =-0.001 y x, = -3000. 


Solución En la figura 3.13 se muestra un programa en Excel/VBA que calcula las raíces x; y x> 
usando la fórmula cuadrática (ecuación 3.12). Observe que se dan las versiones tanto de la precisión 
simple como la precisión doble. Mientras que los resultados para x, son adecuados, el error rela- 
tivo porcentual para x, es pobre para la precisión simple, e, = 2.4%. Este valor quizá resulte inade- 
cuado para muchos problemas de aplicaciones en ingeniería. ¡Este resultado es en particular 
sorpresivo porque se emplea una fórmula analítica para obtener la solución! 

La pérdida de significancia ocurre en la línea del programa donde dos números grandes se 
restan. No ocurren problemas semejantes cuando los mismos números se suman. 

Considerando lo anterior podemos obtener la conclusión general de que la fórmula cuadrática 
será susceptible de cancelación por resta cada vez que b? > 4ac. Una manera de evitar este problema 
consiste en usar precisión doble. Otra es reacomodar la fórmula cuadrática en la forma de la ecuación 
(3.13). Ya que en la salida del programa, ambas opciones dan un error mucho menor porque se mi- 
nimiza o evita la cancelación por resta. 


Considere que, como en el ejemplo anterior, hay veces en las que la cancelación por resta se evita 
empleando una transformación. No obstante, el único remedio general es usar la precisión extendida. 


Dispersión La dispersión ocurre generalmente cuando los términos individuales en la sumatoria 
son más grandes que la sumatoria misma. Como en el siguiente ejemplo, casos como éstos ocurren 
en las series con signos alternados. 


EJEMPLO 3.9 Evaluación de e* usando series infinitas 


Planteamiento del problema La función exponencial y = e* está dada por la serie infinita 


2 3 
y Td o 
2 3 


Evalúe esta función para x= 10 y x =-—10; esté atento al problema del error de redondeo. 


Solución En la figura 3.14a se muestra un programa en Excel/VBA que utiliza una serie infinita 
para evaluar e*. La variable ¡ es el número de términos en la serie, term es el valor de término actual 
que se le agrega a la serie, y sum es el valor acumulado de la serie. La variable test es el valor acu- 
mulado precedente de la serie antes de la suma de term. La serie se termina cuando la computadora 
no puede detectar la diferencia entre test y sum. 

La figura 3.14b muestra los resultados de la ejecución del programa para x = 10. Observe que 
este caso es completamente satisfactorio. El resultado final se alcanza en 31 términos con la serie 
idéntica para el valor de la función en la biblioteca con siete cifras significativas. 

En la figura 3.14c se muestran los resultados para x =—10. Sin embargo, en este caso, los resul- 
tados de la serie calculada no coinciden ni en el signo con respecto al resultado verdadero. De hecho, 
los resultados negativos abren una gama de preguntas serias porque e* nunca puede ser menor que 
cero. El problema es causado por el error de redondeo. Observe que muchos de los términos que con- 
forman la suma son mucho más grandes que el resultado final de la suma. Además, a diferencia del 
caso anterior, los términos individuales varían de signo. Así, en efecto, estamos sumando y restando 
números grandes (cada uno con algún error pequeño) y dando gran significancia a las diferencias; 
esto es, cancelación por resta. Entonces, puede verse que el culpable en este ejemplo de dispersión 
es, en efecto, la cancelación por resta. En tales casos es apropiado buscar alguna otra estrategia de 
cálculo. Por ejemplo, uno podría tratar de calcular y = e? como y = (e7!)'%. En lugar de una reformu- 
lación, ya que el único recurso general es la precisión extendida. 


3.4 Errores de redondeo 


a) Programa b) Evaluación de e!” 
; ed A | B (e; 
Option Explicit 
A 10 
Ñ Z i term sum 
SES ia A Aeon 3 0 1.000000 1.000000 
2 COn DA Sn. ESO DA BUnale 4 1 10.000000 11.000000 
Dim sum As Single, x As Single 5 2 50.000000 61.000000 
Damas Re” Taoegee 3 3 165.666672  227.668672 
i= 0: term = 14: sum = 14: test = Of 7 4 416.666656 644333313 
Sheets ("sheet1") .Select 8 5 833.333313 1477 666626 
Range ("b1").Select 
xXx = ActiveCell.Value (30 | 27.  9.183690E-02  22026.416016 
Range ("a3:c1003") .ClearContents > = as o 
R "a3") .Select : - - 
A ASE El 30 3.769988E-03  22025.454844 
e ; (34 | 31. 1.2161255-03  22026.466797 
ri 35 Exact value = | 22026.465795 
ActiveCell.Value = i 
ActiveCell.Offset(0, 1) .Select €) Evaluación de e" 
ActiveCell.Value = term 
ActiveCell.Offset(0, 1).Select A B C 
ActiveCell.Value = sum 1 lx -10 
ActiveCell.Offset (1, -2) .Select (2| ¡ term sum 
i= 3 i+.1 E D 1.000000 1.000000 
test = sum 4 1 -10.000000 -9.000000 
term =x"i/-_ 5 2 50.000000 41.000000 
Application.WorksheetFunction.Fact (1) MES 31 -166.6606721  -125.666672 
sum E sum + orm Í 4 416.566656 291.000000 
lod 8 5 -833.333313 -542.333313 
ActiveCell.Offset(0, 1) .Select (44 | 41. -2.989311€-09 — 1.103359E-04 
ActiveCell.Value = "Exact value = " 45 42  7.117407E-10  1.103366E-04 
ActiveCell.Offset(0, 1) .Select 46 43  -1.655211€-10. 1.103365E-04 
ActiveCell.Value = Exp(x) 47 44 — 3.761843E-11. 1.103365E-04 
End Sub (48 45  -8.359651E-12 1.103365E-04 
| 49 | Exact value = 4.539993E-05 


Figura 3.14 


a) Un programa Excel/VBA para evaluar e* usando una serie infinita. b) Evaluación de e*. c) Evaluación de e”. 


Productos internos De las secciones anteriores debe quedar claro que, algunas series infinitas 
son particularmente propensas a errores por redondeo. Por fortuna, el cálculo de series no es una de 
las operaciones más comunes en métodos numéricos. Una manipulación más frecuente es el cálculo 
de productos internos, esto es, 


ñ 

0 = X Y Xy HR Y 

i=l 
Esta operación es muy común, en particular en la solución de ecuaciones simultáneas lineales alge- 
braicas. Tales sumatorias son propensas a errores por redondeo. En consecuencia, a menudo es de- 
seable calcular tales sumas con precisión extendida. 

Aunque en las secciones siguientes se ofrecerán reglas prácticas para reducir el error de redon- 
deo, no son un medio directo mejor que el método de prueba y error para determinar realmente el 
efecto de tales errores en los cálculos. En el próximo capítulo se presentará la serie de Taylor, la cual 
proporcionará un enfoque matemático para estimar esos efectos. 
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PROBLEMAS 


3.1 Convierta los números que se presentan base 2 a base 10: a) 
101101; b) 110.011 y c) 0.01101. 

3.2 Convierta los siguientes números base 8 a base 10: 71263 y 
3.147. 

3.3 Realice su propio programa con base en la figura 3.11 y úselo para 
determinar el épsilon de máquina de su computadora. 

3.4 En forma similar a la de la figura 3.11, escriba un programa corto 
para determinar el número más pequeño, Xy, que utiliza la compu- 
tadora que empleará con este libro. Observe que su computadora será 
incapaz de diferenciar entre cero y una cantidad más pequeña que 
dicho número. 

3.5 La serie infinita 


1m-Y> 


converge a un valor de f(n) = x1*/90 conforme n se tiende a infinito. 
Escriba un programa de precisión sencilla para calcular f(n) para n 
= 10000 por medio de calcular la suma desde ¡= 1 hasta 10000. 
Después repita el cálculo pero en sentido inverso, es decir, desde ¡ = 
10000 a 1, con incrementos de —1. En cada caso, calcule el error 
relativo porcentual verdadero. Explique los resultados. 

3.6 Evalúe e? con el uso de dos métodos 

e 3: 


e*=l-1i4+ + 
2 31 


1 1 
EE 7 3 


a 
ZO 


y compárelo con el valor verdadero de 6.737947 x 10, Utilice 20 
términos para evaluar cada serie y calcule los errores relativos aproxi- 
mado y verdadero como términos que se agregaran. 

3.7 La derivada de f(x) = 1/(1 — 3x1?) está dada por 

Óx 
(1-31?) 

¿Esperaría dificultades para evaluar esta función para x=0.577? 
Inténtelo con aritmética de 3 y 4 dígitos con corte. 


3.8 a) Evalúe el polinomio 
y=x-512+6x + 0.55 


en x= 1.37. Utilice aritmética de 3 dígitos con corte. Evalúe el error 
relativo porcentual. 
b) Repita el inciso a) pero exprese a y como 


y = ((x4—S)x + 6)x + 0.55 


Evalúe el error y compárelo con el inciso a). 

3.9 Calcule la memoria de acceso aleatorio (RAM) en megabytes, 
que es necesaria para almacenar un arreglo multidimensional de 20 
x 40 x 120. Este arreglo es de doble precisión, y cada valor requiere 
una palabra de 64 bits. Recuerde que una palabra de 64 bits = 8 bytes, 
y un kilobyte = 2!” bytes. Suponga que el índice comienza en 1. 
3.10 Determine el número de términos necesarios para aproximar cos 
xa8 cifras significativas con el uso de la serie de Maclaurin. 


xd y Y ] x 


241 6181 

Calcule la aproximación en donde el valor de x = 0.371. Escriba un 
programa para determinar el resultado. 

3.11 Utilice aritmética de 5 dígitos con corte para determinar las 


raíces de la ecuación siguiente, por medio de las ecuaciones (3.12) y 
(3.13). 


x2-5000.002x + 10 


cosx=1 


Calcule los errores relativos porcentuales de sus resultados. 

3.12 ¿Cómo puede emplearse el épsilon de la máquina para formu- 
lar un criterio de detención e, para sus programas? Dé un ejemplo. 
3.13 El método “dividir y promediar”, un antiguo método para 
aproximar la raíz cuadrada de cualquier número positivo a se puede 
formular como 


_ x+a/x 
2 


Escriba una función bien estructurada para implementar este algorit- 
mo basado en el algoritmo descrito en la figura 3.3. 


Errores de truncamiento 
y la serie de Taylor 


Los errores de truncamiento son aquellos que resultan al usar una aproximación en lugar de un 
procedimiento matemático exacto. Por ejemplo, en el capítulo 1 aproximamos la derivada de la ve- 
locidad de caída de un paracaidista mediante una ecuación en diferencias finitas divididas de la 
forma [ecuación (1.11)] 


dv e Av _ v(t,,)—v(t,) 
dt Ñ At Dig É 


(4.1) 


Se presentó un error de truncamiento en la solución numérica, ya que la ecuación en diferencia sólo se 
aproxima al valor exacto de la derivada (véase figura 1.4). Para obtener un conocimiento sobre las 
características de estos errores, debe considerar una formulación matemática que se utiliza amplia- 
mente en los métodos numéricos para expresar funciones de manera aproximada: la serie de Taylor. 


4.1 LA SERIE DE TAYLOR 


El teorema de Taylor (véase cuadro 4.1) y su fórmula, la serie de Taylor, es de gran valor en el estu- 
dio de los métodos numéricos. En esencia, la serie de Taylor proporciona un medio para predecir el 
valor de una función en un punto en términos del valor de la función y sus derivadas en otro punto. 
En particular, el teorema establece que cualquier función suave puede aproximarse por un polinomio. 

Una buena manera de comprender la serie de Taylor consiste en construirla término por térmi- 
no. Por ejemplo, el primer término de la serie es: 


FO) = A) (4.2) 


Esta relación, llamada la aproximación de orden cero, indica que el valor de fen el nuevo punto es 
el mismo que su valor en el punto anterior. Tal resultado tiene un sentido intuitivo, ya que Si x; Y X;,, 
están muy próximas entre sí, entonces es muy probable que el nuevo valor sea similar al anterior. 

La ecuación (4.2) ofrece una estimación perfecta si la función que se va a aproximar es, de 
hecho, una constante. Sin embargo, si la función cambia en el intervalo, entonces se requieren los 
términos adicionales de la serie de Taylor, para obtener una mejor aproximación. Por ejemplo, la 
aproximación de primer orden se obtiene sumando otro término para obtener: 


Fi) = F (0) + PO — 4) (4.3) 


El término adicional de primer orden consiste en una pendiente f'(x,) multiplicada por la distancia 
entre x; y X;,¡. Por lo tanto, la expresión representa ahora una línea recta y es posible predecir un 
incremento o un decremento de la función entre x, y X;,,¡. 

Aunque la ecuación (4.3) puede predecir un cambio, sólo es exacta para una línea recta o una 
tendencia lineal. Por lo tanto, se le agrega a la serie un término de segundo orden para obtener algo 
de la curvatura, que pudiera presentar la función: 

f(x) 2 

FO) E FA) AO ss 11) + 2! (Aj — X) (4.4) 
De forma similar, se agregan términos adicionales para desarrollar la expansión completa de la serie 
de Taylor: 
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Cuadro 4.1 Teorema de Taylor 


Teorema de Taylor 


Si la función f y sus primeras n + 1 derivadas son continuas en un 
intervalo que contiene a y x, entonces el valor de la función en x está 
dado por 


rotar arar Laa 
¿LO a 
¡Li a) +R, (C4.1.1) 
donde el residuo R, se define como 
ES a GO” od (C4.1.2) 


donde f es una variable muda. La ecuación (C4.1.1) se llama serie de 
Taylor o fórmula de Taylor. Si se omite el residuo, el lado derecho de 
la ecuación (C4.1.1) es la aproximación del polinomio de Taylor para 
KG). En esencia, el teorema establece que cualquier función suave 
puede aproximarse mediante un polinomio. 

La ecuación (C4.1.2) es sólo una manera, denominada la forma 
integral, mediante la cual puede expresarse el residuo. Se obtiene 
una formulación alternativa basándose en el teorema del valor medio 
para integrales. 


Primer teorema del valor medio 
para integrales 


Si la función g es continua e integrable en un intervalo que contenga 
a y x, entonces existe un punto É entre a y x tal que 


' g(Odt = g(ÉXx-a) (C4.1.3) 


Capítulo 4 Errores de truncamiento y la serie de Taylor 


En otras palabras, el teorema establece que la integral puede repre- 
sentarse por un valor promedio de la función g(£) multiplicado por 
la longitud del intervalo x — a. Como el promedio debe encontrarse 
entre los valores mínimo y máximo del intervalo, existe un punto 
x = ¿en el cual la función toma el valor promedio. 

El primer teorema es, de hecho, un caso especial del segundo 
teorema del valor medio para integrales. 


Segundo teorema del valor medio 
para integrales 


Si las funciones g y h son continuas e integrables en un intervalo que 
contiene a y x, y h no cambia de signo en el intervalo, entonces 
existe un punto É entre a y x tal que 


1 g(0h(Ddt = (5) na (C4.1.4) 


La ecuación (C4.1.3) es equivalente a la ecuación (C4.1.4) con h(1) 
=1, 

El segundo teorema se aplica a la ecuación (C4.1.2) con 
(x 


pi. 


eo= “o híf= 


Conforme t varía de a a x, h(£) es continua y no cambia de signo. Por 
lo tanto, si £“*Y(t) es continua, entonces se satisface el teorema del 
valor medio para integrales y 


¿PAS MO 


n+l 
TS 


Esta ecuación es conocida como la forma de Lagrange o derivada 
del residuo. 


O 
(3) (n) 
, a ¡CAES E Abra , = E Xx" +R, (43) 


Observe que debido a que la ecuación (4.5) es una serie infinita, el signo igual reemplaza al signo 
de aproximación que se utiliza en las ecuaciones (4.2) a (4.4). Se incluye un término residual para 
considerar todos los términos desde el n + 1 hasta infinito: 


Mo 


n+l 
de 
n M+D! ( i+l ») 


(4.6) 
donde el subíndice n indica que éste es el residuo de la aproximación de n-ésimo orden y £ es un 
valor de x que se encuentra en algún punto entre x, y X;,¡. La £ es tan importante que se dedica una 
sección completa (sección 4.1.1) para su estudio. Por ahora es suficiente darse cuenta de que existe 
este valor que da una evaluación exacta del error. 
Con frecuencia es conveniente simplificar la serie de Taylor definiendo un tamaño de paso o 
incremento h = x,,, — x, y expresando la ecuación (4.5) como: 
"” (3) (n) 
ze X; X; 
EL q O q 


FG) = (+ FG )h+ (4.7) 


4.1 La serie de Taylor 


donde el término residual es ahora 


e= de 105) pe 


E (00) 


EJEMPLO 4.1 Aproximaciones de un polinomio mediante la serie de Taylor 


Planteamiento del problema Use expansiones de la serie de Taylor de los órdenes cero hasta 
cuatro para aproximar la función 


FG) =-0.14* - 0.151 - 0.57 — 0.25x + 1.2 


desde x,= 0 con h= 1. Esto es, estime el valor de la función en x,,, = 1. 


Solución Ya que se trata de una función conocida, es posible calcular valores de f(x) entre 0 y 1. 
Los resultados (véase figura 4.1) indican que la función empieza en f(0) = 1.2 y hace una curva hacia 
abajo hasta f(1) = 0.2. Por lo tanto, el valor exacto que se intenta predecir es 0.2. 

La aproximación de la serie de Taylor con n = 0 es [ecuación (4.2)] 


Hi.) = 1.2 


Como se muestra en la figura 4.1, la aproximación de orden cero es una constante. Usando esta 
formulación resulta un error de truncamiento [recuerde la ecuación (3.2)] de 


E,=0.2-1.2=-1.0 


enx=l. 
Para n = 1, se debe determinar y evaluar la primera derivada en x=0: 


F"(0) = -0.4(0.0) — 0.45(0.0) — 1.0(0.0) — 0.25 =-0.25 
La aproximación de primer orden es entonces [véase ecuación (4.3)] 
FO) = 1.2 — 0.25h 


que se emplea para calcular f(1) = 0.95. La aproximación empieza a coincidir con la trayectoria 
hacia abajo de la función en forma de una línea recta inclinada (véase figura 4.1). De esta manera, 
el error de truncamiento se reduce a 


E,=0.2-—0.95 =-0.75 


Fx) 


Orden cero 


Fr) = FX) 


FO + 1) = SF) + A )h 


0.5 — dí 


10.0 =10) +10 2 2 


ACTO) Figura 4.1 


h y segundo. 
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Aproximación de f(x) =-0.1x*-0.1517 - 0.52 
-0.25x + 1.2 en x=1 mediante expansiones 
de la serie de Taylor de órdenes cero, primero 
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Para n = 2, se evalúa la segunda derivada en x=0: 

£"(0) =-1.2(0.0) —0.9(0.0) - 1.0=-1.0 
Entonces, de acuerdo con la ecuación (4.4), 

Fi) = 1.2—0.25h —0.5h? 


y sustituyendo h = 1, £(1) = 0.45. Al incluirse la segunda derivada se añade una curvatura descen- 
dente que proporciona una mejor estimación, como se muestra en la figura 4.1. Además, el error de 
truncamiento se reduce a 0.2 — 0.45 =-—0.25. 

Los términos adicionales mejoran aún más la aproximación. En efecto, la inclusión de la terce- 
ra y de la cuarta derivadas da como resultado exactamente la misma ecuación del principio: 


FG) = 1.2 —0.25h —0.5h?* — 0.15h* -0.1h* 


donde el término residual es 


(5) 
pa 
5! 


ya que la quinta derivada de un polinomio de cuarto orden es cero. Por consiguiente, la expansión 
de la serie de Taylor hasta la cuarta derivada da una estimación exacta para x;,, = 1: 


A) =1.2-0.25(1) -0.5(1?-0.15(1) —0.1(1)*=0.2 


En general, la expansión de la serie de Taylor de n-ésimo orden será exacta para un polinomio 
de n-ésimo orden. Para otras funciones continuas y diferenciables, como las exponenciales y las 
senoidales, no se obtiene una estimación exacta con un número finito de términos. Cada uno de los 
términos adicionales contribuye, aunque sea con poco, al mejoramiento de la aproximación. Esto se 
muestra en el ejemplo 4.2, donde se obtendría un resultado exacto únicamente si se le agrega un 
número infinito de términos. 

Aunque lo anterior es cierto, el valor práctico de las expansiones de la serie de Taylor estriba, 
en la mayoría de los casos, en que el uso de pocos términos que darán una aproximación lo suficien- 
temente cercana a la solución verdadera para propósitos prácticos. La determinación de cuántos 
términos se requieren para obtener una “aproximación razonable” se basa en el término residual de 
la expansión. Recuerde que el término residual es de la forma general de la ecuación (4.8). Dicha fór- 
mula tiene dos grandes inconvenientes. Primero, £ no se conoce con exactitud, sino que sólo se sabe 
que está entre x, y x;,¡. Segundo, para la evaluación de la ecuación (4.8) se requiere determinar la 
(n + 1)-ésima derivada de f(x). Para hacerlo, se necesita conocer f(x). Pero si ya se conoce f(x), en- 
tonces no hay razón para realizar la expansión de la serie de Taylor. 

A pesar de este dilema, la ecuación (4.8) aún resulta útil para la evaluación de errores de trun- 
camiento. Esto se debe a que se tiene control sobre el término h de la ecuación. En otras palabras, 
es posible decidir qué tan lejos de x se desea evaluar f(x) y controlar el número de términos que 
queremos tener en la expansión. Por esto, la ecuación (4.8) se expresa usualmente como 


R, =O(h"") 


donde la nomenclatura O(h"**) significa que el error de truncamiento es de orden h”*!, Es decir, el 
error es proporcional al incremento h elevado a la (n + 1)-ésima potencia. Aunque esta aproximación 
no implica nada en relación con la magnitud de las derivadas que multiplican h"*!, es extremada- 
mente útil para evaluar el error comparativo de los métodos numéricos que se basan en expansiones 
de la serie de Taylor. Por ejemplo, si el error es O(h) y el incremento se reduce a la mitad, entonces 
el error también se reducirá a la mitad. Por otro lado, si el error es O(h?) y el incremento se reduce 
a la mitad, entonces el error se reducirá a una cuarta parte. 

En general, se considera que el error de truncamiento disminuye agregando términos a la serie 
de Taylor. En muchos casos, si h es suficientemente pequeño, entonces el término de primer orden 


4.1 La serie de Taylor 


y Otros términos de orden inferior causan un porcentaje desproporcionadamente alto del error. Esta 
propiedad se ilustra en el ejemplo siguiente. 


EJEMPLO 4.2 Uso de la expansión de la serie de Taylor para aproximar una 
función con un número infinito de derivadas 


Planteamiento del problema Utilice expansiones de la serie de Taylor con n desde O hasta 6 
para aproximar f(x) = cos x en x;,,, = 75/3 con base en el valor de f(x) y sus derivadas en x, = 71/4. 
Observe que esto significa que h = 73/3 — 70/4 = 13/12. 


Solución Como en el ejemplo 4.1, el conocimiento de la función original implica que se puede 
determinar el valor exacto de f(71/3) = 0.5. 
La aproximación de orden cero es [ecuación (4.3)] 


(2) = cos (5) =0.707106781 
3 4 


que representa un error relativo porcentual de 


_ 0.5-—0.707106781 
0.5 
Para la aproximación de primer orden, se agrega el término de la primera derivada donde f(x) = sen x: 


1(%)=cos(%) sen[ 7 [5 )- 0521986650 
3 4 4JU2 


que tiene e, = -4.40 por ciento. 
Para la aproximación de segundo orden, se agrega el término de la segunda derivada donde f(x) 
=-—COS X: 


(2) (2) (212) O ES 
f = Cos sen =0.497754491 
3 4 412 2 12 


con e, = 0.449 por ciento. Entonces, al agregar más términos a la serie se obtiene una mejor aproxi- 
mación. 

Este proceso continúa y sus resultados se enlistan, como en la tabla 4.1. Observe que las deriva- 
das nunca se aproximan a cero, como es el caso con el polinomio del ejemplo 4.1. Por lo tanto, cada 
término que se le agrega a la serie genera una mejor aproximación. Sin embargo, observe también 
que la mejor aproximación se consigue con los primeros términos. En este caso, al agregar el tercer 
término, el error se redujo al 2.62 x 10%, lo cual significa que se alcanzó el 99.9738% del valor 
exacto. Por consiguiente, aunque la adición de más términos reducirá el error, la mejoría será mínima. 


100% = 41.4% 


t 


Tabla 4.1 Aproximaciones mediante la serie de Taylor de f(x) = cos x en x;,, = 732/3 usando 
como punto base 71/4. Los valores se presentan para varios órdenes (n) de 
aproximación. 


Orden n fo) f(70/3) E, 
10) COS X 0.707106781 -41.4 
1 =Sen X 0.521986659 -4.4 
2 COS X 0.497754491 0.449 
3 sen x 0.499869147 2.62 x 107? 
4 COS X 0.500007551 1.51 x 107 
5 =sen X 0.500000304 -6.08 x 107 
6 


COS X 0.499999988 2.40 x 10% 
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4.1.1 El residuo en la expansión de la serie de Taylor 


Antes de mostrar cómo se utiliza la serie de Taylor en la estimación de errores numéricos, se debe 
explicar por qué se incluye el argumento £ en la ecuación (4.8). El desarrollo matemático se presen- 
ta en el cuadro 4.1. Ahora se expondrá una interpretación más visual. Después se extiende este caso 
específico a una formulación más general. 

Suponga que se trunca la expansión de la serie de Taylor [ecuación (4.7)] después del término 
de orden cero para obtener: 


FO) = Ax) 


En la figura 4.2 se muestra una representación gráfica de esta predicción de orden cero. El residuo 
o error de esta predicción, que se indica también en la figura, consiste de la serie infinita de términos 
que fueron truncados: 


” (€) 
f CAPS A 
2! 3! 


R,=f'(x,h+ 


Obviamente no resulta conveniente manipular el residuo en este formato de serie infinita. Se 
obtiene una simplificación truncando el residuo mismo de la siguiente manera 


R,¿=f(x)h (4.9) 


Aunque como se mencionó en la sección previa, por lo común las derivadas de orden inferior cuen- 
tan mucho más en el residuo que los términos de las derivadas de orden superior; este resultado 
todavía es inexacto, ya que se han despreciado los términos de segundo orden y de órdenes superio- 
res. Esta “inexactitud” se denota mediante el símbolo de aproximación a la igualdad (=) empleado 
en la ecuación (4.9). 

Una simplificación alternativa que transforma la aproximación en una equivalencia está basada 
en un esquema gráfico. Como se muestra en la figura 4.3 el teorema del valor medio para la deri- 
vada establece que si una función f(x) y su primera derivada son continuas en el intervalo de x, a x;,.;, 
entonces existe al menos un punto en la función que tiene una pendiente, denotada por f'(£), que es 
paralela a la línea que une f(x) y f(x,,,). El parámetro £ marca el valor x donde se presenta la pen- 
diente (figura 4.3). Una ilustración física de este teorema es la siguiente: si usted viaja entre dos 
puntos a una velocidad promedio, habrá al menos un momento durante el curso del viaje en que 
usted se mueve a esa velocidad promedio. 

Al utilizar este teorema resulta fácil darse cuenta, como se muestra en la figura 4.3, de que la 
pendiente f'(£) es igual al cociente de la elevación R, entre el recorrido h, o 


Ej 0 
> 


que se puede reordenar para obtener 
Ry=f(E)h (4.10) 


Por lo tanto, se ha obtenido la versión de orden cero de la 
ecuación (4.8). Las versiones de orden superior son tan 
sólo una extensión lógica del razonamiento usado para 
encontrar la ecuación (4.10). La versión de primer orden 
es 


LO 


h? (4.11) 


Figura 4.2 


Representación gráfica de una predicción de orden cero con 


la serie de Taylor y del residuo. 


4.1 La serie de Taylor 


En este caso, el valor de £ será el valor de x que corresponde a la derivada de segundo orden que 
hace exacta a la ecuación (4.11). Es posible obtener versiones similares de orden superior a partir 
de la ecuación (4.8). 


4.1.2 Uso de la serie de Taylor para estimar los errores 
de truncamiento 


Aunque la serie de Taylor será muy útil en la estimación de los errores de truncamiento a lo largo de 
este libro, quizá no resulte claro cómo la expansión se aplica a los métodos numéricos. De hecho, 
esto ya se hizo en el ejemplo de la caída del paracaidista. Recuerde que el objetivo de los ejemplos 
1.1 y 1.2 fue predecir la velocidad como una función del tiempo. Es decir, se deseaba determinar 
v(t). Como se especificó en la ecuación (4.5), v(t) se puede expandir en una serie de Taylor del si- 
guiente modo: 


” 
vt, 
MEX 


a da iRR (4.12) 


Ult.) =V(t,) +v (E, Mt,,, —,) 


Ahora, truncando la serie después del término con la primera derivada, se obtiene: 
Ulf;a) = V(1) + VU) 1) HR (4.13) 
En la ecuación (4.13) se despeja obteniendo 


Ut ;,1) —v(1,) E R; 


v(t,)= 
Dior L, l; 


(4.14) 


Aproximación Error de 
de primer orden truncamiento 


La primera parte de la ecuación (4.14) es exactamente la misma relación que se usó para aproximar 
la derivada del ejemplo 1.2 [ecuación (1.11)]. Sin embargo, con el método de la serie de Taylor se ha 
obtenido una estimación del error de truncamiento asociado con esta aproximación de la derivada. 
Utilizando las ecuaciones (4.6) y (4.14) se tiene 


R|__v6) 
= —ÁA li — l; 4.15 
a 7 21 ( +1 1) ( ) 
0) 
R 
= Ot, —!, 4.16 
1 tf ( i+1 1) ( ) f0) 


Pendiente =f(£) 


Por lo tanto, la estimación de la derivada [ecuación (1.11) o la 
primera parte de la ecuación (4.14)] tiene un error de trunca- 
miento de orden f,,, — £,, En otras palabras, el error en nuestra 
aproximación de la derivada debería ser proporcional al ta- 
maño del incremento. Entonces, si éste se divide a la mitad, 
se esperaría que el error de la derivada se reduzca a la mitad. 


OA 


A R 
Pendiente = 


69 


Figura 4.3 
Representación gráfica del teorema del valor medio para la Xx ES +1 x 
derivada. —_—o——— 
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EJEMPLO 4.3 El efecto de no linealidad y del tamaño del incremento 
en la aproximación de la serie de Taylor 
Planteamiento del problema En la figura 4.4 se grafica la función 
mer (E4.3.1) 


para m= 1,2, 3 y 4 en el rango de x= 1 a2. Observe que para m= 1 la función es lineal, y conforme 
m se incrementa, se presenta mayor curvatura o no linealidad dentro de la función. 

Utilizar la serie de Taylor de primer orden para aproximar la función con diversos valores del 
exponente m y del tamaño de incremento h. 


Solución La ecuación (E4.3.1) se aproxima por una expansión de la serie de Taylor de primer 
orden: 


Fi) = Mx) + mx" h (E4.3.2) 
la cual tiene un residuo de 


” (€) (4) 
E) y y L CAP PD. 
2! 31 ! 


R, 


Primero, puede examinarse cómo se comporta la aproximación conforme m aumenta; es decir, 
conforme la función se vuelve más no lineal. Para m = 1, el valor exacto de la función en x=2.€es 2. 
La serie de Taylor nos da 


fQ)=1+1(1)=2 


El residuo es cero porque la segunda derivada y las derivadas de 
orden superior de una función lineal son cero. Entonces, como es 
de esperarse, la expansión de la serie de Taylor de primer orden 
es perfecta cuando la función de que se trata es lineal. 

Para m=2, el valor real es f(2) = 2? = 4. La aproximación de 
la serie de Taylor de primer orden es 


f2)=1+21)=3 


R|=3(1)+0+0+--=1 


Debido a que la función es una parábola, la aproximación median- 
te una línea recta da por resultado una discrepancia. Observe que 
el residuo se determina en forma exacta. 


Figura 4.4 
Gráfica de la función f(x) = x” para m= 1, 2, 3 y 4. Note que la fun- 


0 > ción tiende a ser más no lineal cuando aumenta m. 


Para m= 3, el valor real es f(2) = 2? = 8. La aproximación 
con la serie de Taylor es 


f0)=1+3000)=4 


R|=20) +2) +0+0+-=4 


Otra vez, hay una discrepancia que se puede determinar exacta- 
mente a partir de la serie de Taylor. 

Para m = 4, el valor real es f(2) = 2*= 16. La aproximación 
con la serie de Taylor es 


f0)=1+40 0) =5 


R=20 +20 +24(0*+0+0+-:=11 


Considerando estos cuatro casos, se observa que R, se incre- 
menta conforme la función empieza a ser cada vez más no lineal. 
Además, R, da cuenta exacta de la discrepancia, porque la ecuación 
(E4.3.1) es un simple monomio con un número finito de derivadas. 
Esto permite una completa determinación del residuo de la serie 
de Taylor. 

Ahora examinemos la ecuación (E4.3.2) para el caso en que 
m=4 y observe cómo R, cambia cuando el tamaño del incremen- 
to h varía. Para m = 4, la ecuación (E4.3.2) es 


fG+h)=f0)+4x;h 


Six=1,f()= 1 entonces esta ecuación se expresa como 


JA +h=1+4h 
con un residuo de 


R,=6H + 4h + h? 
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0.1 


Pendiente = 2 


0.01 H 


0.001 A 
1 0.1 0.01 h 


Figura 4.5 

Gráfica en escala log-log del residuo R, para la aproxima- 
ción de la función fx) = x* mediante la serie de Taylor de 
primer orden contra el tamaño del incremento h. La línea 
con la pendiente 2 también se muestra para indicar que 
conforme h disminuye, el error se vuelve proporcional a ??. 


Lo cual nos lleva a la conclusión de que la discrepancia disminuirá conforme h se reduzca. Entonces, 
para valores suficientemente pequeños de h, el error debería ser proporcional a h?. Es decir, confor- 
me / se reduce a la mitad, el error se reduce a la cuarta parte. Este comportamiento se confirma en 


la tabla 4.2 y en la figura 4.5. 


Tabla 4.2 Comparación del valor exacto de la función f(x) = x” con la aproximación de la serie 
de Taylor de primer orden. Ambos, la función y la aproximación, se evalúan en x + h, 


donde x= 1. 
Aproximación 
h Exacto de primer orden R, 

1 16 5 11 

0.5 5.0625 3 2.0625 
0.25 2.441406 2 0.441406 
0.125 1.601807 1.5 0.101807 
0.0625 1.274429 1.25 0.024429 
0.03125 1.130982 1.125 0.005982 
0.015625 1.063980 1.0625 0.001480 
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De esta forma, se concluye que el error de la aproximación por serie de Taylor de primer orden 
disminuye conforme m se aproxima a 1 y conforme / disminuye. Intuitivamente, esto significa que 
la serie de Taylor adquiere más exactitud cuando la función que se está aproximando se vuelve más 
semejante a una línea recta sobre el intervalo de interés. Esto se logra reduciendo el tamaño del in- 
tervalo o “enderezando” la función por reducción de m. Es obvio que dicha opción usualmente no 
está disponible en el mundo real porque las funciones para analizar son, en forma general, dictadas 
en el contexto del problema físico. En consecuencia, no se tiene control sobre la falta de linealidad 
y el único recurso consiste en reducir el tamaño del incremento o incluir términos adicionales de la 
expansión de la serie de Taylor. 


4.1.3 Diferenciación numérica 


A la ecuación (4.14) se le conoce con un nombre especial en el análisis numérico: diferencias finitas 
divididas y generalmente se representa como 


Py) = LD olx, —x,) (4.17) 
ia A 
0) 
FUx,)= z +0(h) (4.18) 


donde a Af, se le conoce como la primera diferencia hacia adelante y a h se le llama el tamaño del 
paso o incremento; esto es, la longitud del intervalo sobre el cual se realiza la aproximación. Se le 
llama diferencia “hacia adelante”, porque usa los datos en ¡e ¡+1 para estimar la derivada (figura 
4.6a). Al término completo Af/h se le conoce como primera diferencia finita dividida. 

Esta diferencia dividida hacia adelante es sólo una de tantas que pueden desarrollarse a partir 
de la serie de Taylor para la aproximación de derivadas numéricas. Por ejemplo, las aproximaciones de 
la primera derivada utilizando diferencias hacia atrás o diferencias centradas se pueden desarrollar 
de una manera similar a la de la ecuación (4.14). Las primeras usan valores en x,_, y x, (figura 4.6b); 
mientras que las segundas utilizan valores igualmente espaciados alrededor del punto donde la de- 
rivada está estimada (figura 4.6c). Es posible desarrollar aproximaciones más exactas de la primera 
derivada incluyendo términos de orden más alto de la serie de Taylor. Finalmente, todas las versiones 
anteriores se pueden desarrollar para derivadas de segundo orden, de tercer orden y de órdenes su- 
periores. En las siguientes secciones se dan resúmenes breves que ilustran cómo se obtienen algunos 
de estos casos. 


Aproximación a la primera derivada con diferencias hacia atrás La serie de Taylor se 
expande hacia atrás para calcular un valor anterior sobre la base del valor actual, 
YA 
(x;) 
PO) FI Pm EE (4.19) 
Truncando la ecuación después de la primera derivada y reordenando los términos se obtiene 


Fx) f(x) _ AÑ 
h h 


donde el error es O(h), y a Vf, se le conoce como primera diferencia dividida hacia atrás. Véase la 
figura 4.6b para una representación gráfica. 


FU)= (4.20) 


Aproximación a la primera derivada con diferencias centradas Una tercera forma de aproxi- 
mar la primera derivada consiste en restar la ecuación (4.19) de la expansión de la serie de Taylor hacia 
adelante: 
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Fr) = FA) + FA E me id 


para obtener 


(3) 
Fi) = E +... 


de donde se despeja 


Fi) Fi 1) a E h? 


pe 2h 6 
0) 
Pe) = Ed 2 2 _ 012) (4.22) 


La ecuación (4.22) es una representación de las diferencias centradas de la primera derivada. Ob- 
serve que el error de truncamiento es del orden de h? en contraste con las aproximaciones hacia 
adelante y hacia atrás, que fueron del orden de h. Por lo tanto, el análisis de la serie de Taylor ofrece 
la información práctica de que las diferencias centradas son una representación más exacta de la 
derivada (figura 4.6c). Por ejemplo, si disminuimos el tamaño del incremento a la mitad, usando 
diferencias hacia atrás o hacia adelante, el error de truncamiento se reducirá aproximadamente a la 
mitad; mientras que con diferencias centradas el error se reduciría a la cuarta parte. 


Fl) Fi) 


Xx Xi-1 X; x 
b) 
fu) 
| Figura 4.6 
Xa1 pa E Gráfica de aproximaciones con diferencias finitas divididas de la 


i+l 


o primera derivada:a) hacia adelante, b) hacia atrás, c) centrales. 
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EJEMPLO 4.4 Aproximación de derivadas por diferencias finitas divididas 


Planteamiento del problema Use aproximaciones con diferencias finitas hacia adelante y 
hacia atrás de O(h) y una aproximación de diferencias centradas de O(h?) para estimar la primera 
derivada de 


FG) =-0.1x*- 0.151? - 0.517 -0.25x + 1.25 


en x = 0.5 utilizando un incremento de h = 0.5. Repita el cálculo con h = 0.25. Observe que la deri- 
vada se calcula directamente como 


FG) =-0.4 - 0.451? — 1.0x — 0.25 


y se puede utilizar para calcular el valor verdadero como f'(0.5) = 0.9125. 


Solución Para h=0.5, la función se emplea para determinar 


Xi =0 fr) =1.2 
x =0.5 FG) =0.925 
Xi = 1.0 F;,1) = 0.2 
Esos valores sirven para calcular las diferencias divididas hacia adelante [ecuación (4.17), 
.2— 0.92, 
F'(0.5)= A le,| =58.9% 
0.5 
la diferencia dividida hacia atrás [ecuación (4.20)], 
f'(0.5)= Crea = 0.55 le,| =39.7% 
0.5 
y la diferencia dividida centrada [ecuación (4.22)], 
.2-1.2 
fosa 10 le,| =9.6% 
1.0 
Para h= 0.25, 
Xx; 1 =0.25 FG) = 1.10351563 
x =0.5 Fc) =0.925 
Xi =0.75 FO) = 0.63632813 


que se utilizan para calcular la diferencia dividida hacia adelante, 

0.63632813-—0.925 _ 
0.25 

la diferencia dividida hacia atrás, 

0.925-—1.10351563 _ 
0.25 

y la diferencia dividida centrada, 


0.63632813-—1.10351563 _ 
0.5 


f(0.5)= 1.155 [e]=26.5% 


F(0.5)= 0.714 [e =21.7% 


F(0.5)= 0.934  le,|=2.4% 


Para ambos tamaños de paso, la aproximación en diferencias centrales es más exacta que las 
diferencias hacia adelante y hacia atrás. También, como se pronosticó con el análisis de la serie de 
Taylor, dividiendo a la mitad el incremento, se tiene aproximadamente la mitad del error en las di- 
ferencias hacia atrás y hacia adelante y una cuarta parte de error en las diferencias centradas. 


4.2 Propagación del error 


Aproximaciones por diferencias finitas para derivadas de orden superior Además de las 
primeras derivadas, la expansión en serie de Taylor sirve para obtener estimaciones numéricas de 
las derivadas de orden superior. Para esto, se escribe la expansión en serie de Taylor hacia adelante 
para f(x,,,) en términos de f(x;): 


PO) = IA )CN+ LD any ce (423) 


La ecuación (4.21) se multiplica por 2 y se resta de la ecuación (4.23) para obtener 
FOts0) — 2. £(4:1) = (A) + FDA ++ 
de donde se despeja 
Hiro) 24051) + f(x) 
h 


Esta relación se llama la segunda diferencia finita dividida hacia adelante. Manipulaciones simila- 
res se emplean para obtener la versión hacia atrás 


FO) 2, 1) + FX, 2) 
h? 


FU)= + 0(h) (4.24) 


PUE 


+ 0(h) 


y la versión centrada 


Fi) 2 (14 Fi) 


re +0(h?) 


Pa) En 


Como fue el caso con las aproximaciones de la primera derivada, el caso centrado es más exacto. 
Observe también que la versión centrada puede ser expresada en forma alternativa como 


FO) fe) fx) (1) 


” dd h h 
Fx,)= A 


Así, como la segunda derivada es una derivada de la derivada, la aproximación de la segunda diferen- 
cia dividida es una diferencia de dos primeras diferencias divididas. 

Se volverá al tema de la diferenciación numérica en el capítulo 23. Aquí hemos presentado 
este tema porque es un muy buen ejemplo de por qué la serie de Taylor es importante en los mé- 
todos numéricos. Además, varias de las fórmulas vistas en esta sección se emplearán antes del 
capítulo 23. 


4.2 PROPAGACIÓN DEL ERROR 


El propósito de esta sección consiste en estudiar cómo los errores en los números pueden propagar- 
se a través de las funciones matemáticas. Por ejemplo, si se multiplican dos números que tienen 
errores, nos gustaría estimar el error de este producto. 


4.2.1 Funciones de una sola variable 


Suponga que se tiene la función f(x) que es dependiente de una sola variable independiente x. Consi- 
dere que X' es una aproximación de x. Por lo tanto, se desearía evaluar el efecto de la discrepancia 
entre x y X en el valor de la función. Esto es, se desearía estimar 


Af%) = |fx) AD] 


El problema para evaluar Af(X%) es que se desconoce f(x) porque se desconoce x. Se supera esta di- 
ficultad si X está cercana a x y f(X) es continua y diferenciable. Si se satisfacen estas condiciones se 
utiliza la serie de Taylor para calcular f(x) cerca de £(%), 
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ON oa rara 


Quitando el segundo término, los de orden superior, y reordenan- 
do, se obtiene 


! 
I 
IF) Ax Error verdadero FO) FO) = FOX) 
Error 1 
estimado A O 
| I l 
o | PS 2=23 a ES 
| FSE (4.25) 
I I 
donde Af(X) = |f o) —F )| representa una estimación del error de 
, la función y AX = |a —X | representa una estimación del error de x. 
da Az s a La ecuación (4.25) proporciona la capacidad de aproximar el error 
en f(x) dando la derivada de una función y una estimación del error 
Figura 4.7 Ea o o La figura 4.7 es una gráfica que re- 
Representación gráfica de la propagación del error de pri- Pp eb a: 
mer orden. 


EJEMPLO 4.5 Propagación del error en una función de una variable 


Planteamiento del problema Dado un valor de Y = 2.5 con un error AX = 0.01, estime el error 
resultante en la función f(x) = x1. 
Solución Con la ecuación (4.25), 
AF) = 3Q.5(0.01) = 0.1875 
Ya que f(Q2.5) = 15.625, se pronostica que 
fQ.S) = 15.625 + 0.1875 


o que el valor verdadero se encuentra entre 15.4375 y 15.8125. De hecho, si x fuera realmente 2.49, 
la función se evaluaría como 15.4382, y si x fuera 2.51, el valor de la función sería 15.8132. Para 
este caso, el análisis del error de primer orden proporciona una estimación adecuada del error 
verdadero. 


4.2.2 Funciones de más de una variable 


El enfoque anterior puede generalizarse a funciones que sean dependientes de más de una variable 
independiente, lo cual se realiza con una versión para varias variables de la serie de Taylor. Por 
ejemplo, si se tiene una función de dos variables independientes, u y v, la serie de Taylor se escribe 
como 


FU, ,0,1)= f(U,,0,)+ Y (U,,, —4,)+ Y (0,1 0) 
u dv 


1 a? a? 
+ 21 E (4, uy +2 E (U,., u; AA v,) 


f 
Py ia E 2 pesa (4.26) 


donde todas las derivadas parciales se evalúan en el punto base í. Si no se consideran todos los tér- 
minos de segundo orden y de orden superior, de la ecuación (4.26) puede despejarse 


4.2 Propagación del error 


Af(ú,v)= Y | EA | Ad 


A 
u dv 


donde Ay y AY son estimaciones del error en u y v, respectivamente. 
Para n variables independientes X',, X»,..., X, teniendo errores AX ,, AX,,..., Ax, se satisface la 
siguiente relación general: 


z AA EE (4.27) 
Ox 


n 


AX X>>....X,)= ds Jas, +12 


EJEMPLO 4.6 Propagación del error en una función con varias variables 


Planteamiento del problema La deflexión y de la punta de un mástil en un bote de vela es 


_FE 
%= SEL 
donde F = una carga lateral uniforme (N/m), £ = altura (m), E = el módulo de elasticidad (N/m?) e /= 


el momento de inercia (m?). Estime el error en y con los siguientes datos: 


F=750 N/m AF = 30 N/m 
L =9m AL =0.03 m 

=7.5 x 10? N/m? AE =5x 10” N/m? 
E = 0.0005 m'* AT = 0.000005 m* 


Solución Empleando la ecuación (4.27) se tiene 
dy dy 
OL JE 


dy 


AF+ HA AL A AE + 
ol 


al 


O O a E CA 
NN = + 3 DER 27 
8El 2 El SE“I 8El 


Sustituyendo los valores adecuados se obtiene 
Ay =0.006561 + 0.002187 + 0.001094 + 0.00164 = 0.011482 


Por consiguiente, y = 0.164025 + 0.011482. En otras palabras, y está entre 0.152543 y 0.175507 m. 
La validez de estos estimados se puede verificar sustituyendo los valores extremos de las variables 
en la ecuación para generar un mínimo exacto de 

720(8.97)* 


Ymín = = 0.152818 
8(7.55 x 10%0.000505 


780(9.03)* 
= 20 = 0.175790 


Imáx = 87.45 x 109%0.000495 


Así, los estimados de primer orden están razonablemente cercanos a los valores exactos. 


La ecuación (4.27) se utiliza para definir relaciones en la propagación de errores con las opera- 
ciones matemáticas comunes. Los resultados se resumen en la tabla 4.3. Se deja el desarrollo de 
estas fórmulas como un ejercicio de tarea. 
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Tabla 4.3 El error estimado relacionado con las 
operaciones matemáticas comunes usando 
números inexactos Ú y V. 


Operación Error estimado 
Adición A(U +V) AU + AV 
Sustracción A(U —V) AU + AV 
Multiplicación A(U x V) JO ]AV + [V]AG 
División a?) 12) 47 +|v)Aú 
v 12 
v 


4.2.3 Estabilidad y condición 


La condición de un problema matemático relaciona su sensibilidad con los cambios en los datos de 
entrada. Se dice que un cálculo es numéricamente inestable si la inexactitud de los valores de entra- 
da se aumenta considerablemente por el método numérico. 

Estas ideas pueden estudiarse usando la serie de Taylor de primer orden 


FO=f0+F (00) 
Esta relación se emplea para estimar el error relativo de f(x) como en 
FO _ FOX) 
fo 76) 


El error relativo de x está dado por 


x—xX 
Xx 
Un número de condición puede definirse como la razón entre estos errores relativos 
areas 
, ciao SR) 
Número de condición = . (4.28) 
Xx 


El número de condición proporciona una medida de qué tanto una inexactitud de x se aumenta por 
FG). Un valor de 1 nos indica que el error relativo de la función es idéntico al error relativo de x. 
Un valor mayor que 1 nos señala que el error relativo se amplifica; mientras que para un valor 
menor que 1 nos dice que se atenúa. En funciones con valores muy grandes se dice que están mal 
condicionadas. Cualquier combinación de los factores en la ecuación (4.28), que aumente el valor 
numérico del número de condición, tendería a aumentar inexactitudes al calcular f(x). 


EJEMPLO 4.7 Número de condición 


Planteamiento del problema Calcule e interprete el número de condición para 


WT TT 
=1 rax=>m>+0.1| — 
f(x) = tan x para x o ($) 
RT TT 
=1 rax=>+0.011 — 
f(x) =tan x para x 2 (5) 


Solución El número de condición se calcula como 


pa y] 
Ñ 7 x(/cos”x) 
Número de condición = ———— 
tan x 


Para X = 70/2 + 0.1(70/2) 


1.7279(40.86) _ 
6.314 


Número de condición = -11.2 
Así, la función está mal condicionada. Para X = 7/2 +0.01 (70/2), 
esta situación es aún peor: 


1.5865(4 053) _ 
63.66 

En este caso, la causa principal del mal condicionamiento parece 

ser la derivada. Esto tiene sentido, ya que en la vecindad de x/2, 


la tangente tiende tanto a infinito positivo como a infinito nega- 
tivo. 


Número de condición = 101 


4.3 ERROR NUMÉRICO TOTAL 


El error numérico total es la suma de los errores de truncamien- 
to y de redondeo. En general, la única forma para minimizar los 
errores de redondeo consiste en incrementar el número de cifras 
significativas en la computadora. Adicionalmente, hemos notado 
que el error de redondeo aumentará debido a la cancelación por 
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Punto 
de rendimientos 
decrecientes 


Log error 


Log tamaño de incremento 


Figura 4.8 

Representación gráfica de las relaciones entre el error de 
redondeo y el error de truncamiento que juegan un papel 
importante en el curso de métodos numéricos. Se presenta 
el punto de regreso disminuido, donde el error de redon- 
deo no muestra los beneficios de la reducción del tamaño 


resta o debido a que en el análisis aumente el número de cálculos. — del incremento. 

En contraste, el ejemplo 4.4 demuestra que el error de truncamien- 

to se reduce disminuyendo el tamaño del incremento. Como una 

disminución al tamaño del incremento puede llevar a una cancelación por resta o a un incremento 
de los cálculos, los errores de truncamiento disminuyen conforme los errores de redondeo se incre- 
mentan. En consecuencia, se debe afrontar el siguiente dilema: la estrategia para disminuir un 
componente del error total conduce a un incremento en el otro componente. En un cálculo, se podría 
disminuir el tamaño del incremento para minimizar los errores de truncamiento únicamente para 
descubrir que el error de redondeo empieza a dominar la solución y ¡el error total crece! Así, el re- 
medio empieza a ser un problema (figura 4.8). Es un reto determinar el tamaño del incremento 
apropiado para un cálculo en particular. Se deberá seleccionar un tamaño de incremento grande con 
la finalidad de disminuir la cantidad de cálculos y errores de redondeo para no tener como conse- 
cuencia grandes errores de truncamiento. Si el error total es como se muestra en la figura 4.8, el reto 
es identificar un punto llamado de regreso disminuido donde los errores de redondeo no muestran 
los beneficios de la reducción del tamaño del incremento. 

En casos reales, sin embargo, tales situaciones son relativamente poco comunes, porque muchas 
computadoras utilizan suficientes cifras significativas para que los errores de redondeo no predominen. 
Aunque algunas veces estos errores ocurren y surge una clase de “principio numérico de incertidum- 
bre” que da un límite absoluto sobre la exactitud que puede obtenerse usando ciertos métodos numé- 
ricos computarizados. Se explora dicho caso en la siguiente sección. 


4.3.1 Análisis de errores de diferenciación numérica 


Como se describe en la sección 4.1.3, una aproximación de diferencias centradas de la primera de- 
rivada se puede escribir como [ecuación (4.22)]: 


; ; (3) 
X = Xi 
F (xi) 7 Fl +1) Fl i 1) NN f E, (4.29) 
2h 6 
Valor Aproximación de Error de 
verdadero diferencias finitas truncamiento 


Así, si los dos valores de la función en el numerador de la aproximación de diferencias finitas no 
tienen error de redondeo, el único error se debe al truncamiento. 
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Sin embargo, como se están usando computadoras digitales, los valores de las funciones sí in- 
cluyen error de redondeo como en 


foi) = fa) +e1 
Fis) = Fis) + ei+ 


donde las 1 son los valores redondeados de la función, y las e son los errores asociados de redondeo. 
Sustituyendo estos valores en la ecuación (4.29), se obtiene 


For) FO Otal LO 


F)= 

2h 2h 6 
Valor Aproximación Error de Error de 
verdadero de diferencias finitas redondeo truncamiento 


Se puede ver que el error total de la aproximación por diferencias finitas consiste en un error de 
redondeo que aumenta con el tamaño de los pasos, y un error de truncamiento que disminuye con 
el tamaño de los pasos. 

Suponiendo que el valor absoluto de cada componente del error de redondeo tiene un límite 
superior e, el valor absoluto posible de la diferencia e, , — e, será 2£. Suponga además que la tercera 
derivada tiene un valor absoluto de M. Un límite superior del valor absoluto del error total puede, 
por lo tanto, representarse como 
Pi) $0) _ 8 n2M 


2h 3 5 + 6 (4.30) 


Fx) => 


Error total = 


Un tamaño óptimo de paso se puede determinar diferenciando la ecuación (4.30), igualando a cero 
el resultado y despejando 


113€ 
he is (4.31) 


EJEMPLO 4.8 Errores de redondeo y truncamiento en diferenciación numérica 


Planteamiento del problema En el ejemplo 4.4 se usó una aproximación de diferencias cen- 
tradas de O(h?) para estimar la primera derivada de la siguiente función en x = 0.5, 


f(x) = —0.1x* — 0.15x? — 0.5x? — 0.25x + 1.2 


Realice el mismo cálculo comenzando con h = 1. Luego divida progresivamente el tamaño del in- 
cremento entre un factor de 10 para demostrar cómo se vuelve dominante el redondeo al reducir el 
tamaño del incremento. Relacione sus resultados con la ecuación (4.31). Recuerde que el valor exac- 
to de la derivada es -0.9125. 


Solución Se puede desarrollar un programa para realizar los cálculos y graficar los resultados. 
Para el ejemplo actual, esto se ha hecho con un archivo M de MATLAB. Observe que tanto la fun- 
ción como su derivada analítica se pasan como argumentos. Además, la función genera una gráfica 
de los resultados. 


function diffex(func,dfunc,x,n) 
format long 
dftrue=dfunc (x); 


) 
D (1) =(func (x+h) —func (x-h) ) / (2*h) ; 
)=abs (dftrue-D (1)); 
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h=h/10; 
HA (1)=h; 
D(1)=(func (x+h) -func (x-h) ) /(2*h); 
E (1)=abs (dftrue-D (i)); 
end 
L=[H' D' E*1+; 
fprintf(' step size finite difference true 


errorWn'); 
fprintf ('514.10f $16.14f $16.13fin',1L); 
loglog(H,E),xlabel ('Step Size'),ylabel ('Error') 
title('Plot of Error Versus Step Size') 
format short 


En seguida se puede correr el archivo M usando los siguientes comandos: 
>> ff= (x) -0.1*x"4-0.15*x%3-0.5*x"2-0.25*x+1.2; 
>> df= (x) -0.4*x"3-0.45*x"2-x-0.25; 
>> diffex(ff£,df£,0.5,11) 


Cuando se ejecuta la función, se genera la siguiente salida numérica junto con la gráfica (figura 4.9): 


step size finite difference true error 

1.0000000000 -1.26250000000000 0.3500000000000 
0.1000000000 -0.91600000000000 0.0035000000000 
0.0100000000 -0.91253500000000 0.0000350000000 
0.0010000000 -0.91250035000001 0.0000003500000 
0.0001000000 -0.91250000349985 0.0000000034998 
0.0000100000 -0.91250000003318 0.0000000000332 
0.0000010000 -0.91250000000542 0.0000000000054 
0.0000001000 -0.91249999945031 0.0000000005497 
0.0000000100 -0.91250000333609 0.0000000033361 
0.0000000010 -0.91250001998944 0.0000000199894 
0.0000000001 -0.91250007550059 0.0000000755006 


Los resultados son como se esperaban. Al principio, el redondeo es mínimo, y el estimado está do- 
minado por el error de truncamiento. Por consiguiente, al igual que en la ecuación (4.30), el error 
total cae por un factor de 100 cada vez que se divide el incremento entre 10. Sin embargo, comen- 
zando en h = 0.0001, se ve que el error de redondeo comienza a aumentar y a hacer que disminuya 
la rapidez de disminución del error. Se llega a un error mínimo 

en h= 10?. Más allá de este punto, el error aumenta al hacer- 

se dominante el redondeo. 

Como se trata de una función fácilmente diferenciable, se Gráfica de error contra tamaño de paso 
puede también investigar si estos resultados son congruentes 
con la ecuación (4.31). Primero, se puede estimar M evaluan- 
do la tercera derivada de la función como 


M =1f%(0.5)| =| —2.4(0.5) — 0.9] =2.1 


Como MATLAB tiene una precisión de alrededor de 15 a 16 
dígitos base 10, una estimación aproximada del límite superior 
en el redondeo sería alrededor de e =0.5x 107%, Sustituyendo 
estos valores en la ecuación (4.31), se obtiene 


Error 


Figura 4.9 
Gráfica de error contra tamaño de paso. Incrementos 


A] 
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2/3(0.5 x 10716) 
Bop = q A 
2.1 


=43x 10 


que es del mismo orden que el resultado de 1 x 10”? que se obtuvo con el programa de computación. 


4.3.2 Control de errores numéricos 


En la mayoría de los casos prácticos, no se conoce el error exacto asociado con el método numérico. 
Con excepción, claro está, de cuando obtenemos la solución exacta que vuelve innecesaria la aproxi- 
mación numérica. Por lo tanto, en la mayoría de las aplicaciones en ingeniería debe tenerse algún 
estimado del error en los cálculos. 

No hay una forma sistemática ni general para evaluar el error numérico en todos los problemas. 
En muchos casos, la estimación del error se basa en la experiencia y en el buen juicio del ingeniero. 

Aunque el análisis de error es hasta cierto punto un arte, se sugieren varios lineamientos prác- 
ticos de cálculo: lo primero, y principal, implica tratar de evitar la resta de dos números casi igua- 
les. Cuando esto ocurre, casi siempre se pierden cifras significativas. Algunas veces puede 
reordenarse o reformularse el problema para evitar la cancelación por resta. Y si esto no es posible, 
se utiliza la aritmética de precisión extendida. Además, cuando se suman o se restan números, es 
mejor ordenarlos y trabajar primero con los números más pequeños, lo cual evita perder cifras 
significativas. 

Más allá de estas sugerencias de cálculo, se puede intentar predecir el error numérico total 
usando formulaciones teóricas. La serie de Taylor es la primera herramienta de análisis tanto para 
el error de truncamiento como para el error de redondeo. Varios ejemplos se han presentado en este 
capítulo. La predicción del error numérico total es muy complicada para, incluso, un problema de 
tamaño moderado, y tiende a resultar pesimista. Por lo tanto, únicamente se utiliza para tareas a 
pequeña escala. 

La tendencia es avanzar con los cálculos numéricos e intentar estimar la exactitud de sus resul- 
tados. Esto algunas veces se puede hacer observando si los resultados satisfacen alguna condición o 
ecuación de prueba. O se pueden sustituir los resultados en la ecuación original para verificar si se 
satisface dicha ecuación. 

Por último, usted debería estar preparado para realizar experimentos numéricos que aumenten 
su conocimiento de los errores de cálculo y de posibles problemas mal condicionados. Tales ex- 
perimentos pueden consistir en repetir los cálculos con diferentes tamaños de incremento o mé- 
todo, y comparar los resultados. Llega a emplearse un análisis sensitivo para observar cómo la 
solución cambia cuando se modifican los parámetros del modelo o los valores de entrada. Es 
factible probar distintos algoritmos numéricos que tengan diferente fundamento matemático, que 
se basan en distintas estrategias de cálculo o que tengan diferentes características de convergencia 
y de estabilidad. 

Cuando los resultados del cálculo numérico son extremadamente críticos y pueden implicar la 
pérdida de vidas humanas o tener severas repercusiones económicas, es apropiado tomar precaucio- 
nes especiales. Esto implicaría el uso de dos o más grupos independientes para resolver el mismo 
problema y luego comparar los resultados. 

El papel de los errores será un tópico de preocupación y análisis en todas las secciones de este 
libro. Se dejan estas investigaciones en secciones específicas. 


4.4 EQUIVOCACIONES, ERRORES DE FORMULACIÓN 
E INCERTIDUMBRE EN LOS DATOS 


Aunque las siguientes fuentes de error no están directamente relacionadas con la mayor parte de los 
métodos numéricos de este libro, en algunas ocasiones llegan a tener un gran impacto en el éxito al 
realizar un modelado. Por lo tanto, se deben tener siempre en cuenta cuando se apliquen técnicas numé- 
ricas en el contexto de los problemas del mundo real. 


4.4 Equivocaciones, errores de formulación e incertidumbre en los datos 


4.4.1 Errores por equivocación 


A todos nos son familiares los errores por negligencia o por equivocación. En los primeros años de 
las computadoras, los resultados numéricos erróneos algunas veces se atribuían a las fallas de la 
propia computadora. En la actualidad esta fuente de error es muy improbable y la mayor parte de 
las equivocaciones se atribuyen a fallas humanas. 

Las equivocaciones llegan a ocurrir a cualquier nivel del proceso de modelación matemática y 
pueden contribuir con todas las otras componentes del error. Es posible evitarlos únicamente con un 
sólido conocimiento de los principios fundamentales y mediante el cuidado con el que se enfoque y 
diseñe la solución del problema. 

Las equivocaciones por lo general se pasan por alto en el estudio de un método numérico. Esto 
se debe sin duda al hecho de que los errores son, hasta cierto punto, inevitables. No obstante, recuer- 
de que hay varias formas con las cuales se puede minimizar su aparición. En particular, los buenos 
hábitos de programación que se esbozaron en el capítulo 2 son muy útiles para disminuir las equivo- 
caciones. Además, hay formas simples de verificar si un método numérico funciona correctamente. 
A lo largo del texto, se estudian algunas formas de verificar los resultados de un cálculo numérico. 


4.4.2 Errores de formulación 


Los errores de formulación O de modelo pueden atribuirse al sesgo que implica un modelo matemáti- 
co incompleto. Un ejemplo de un error de formulación insignificante es el hecho de que la segunda ley 
de Newton no toma en cuenta los efectos relativísticos. Esto no desvirtúa la validez de la solución del 
ejemplo 1.1, ya que estos errores son mínimos en las escalas de tiempo y espacio asociadas con el 
problema de la caída del paracaidista. 

Sin embargo, suponga que la resistencia del aire no es linealmente proporcional a la velocidad 
de caída, como en la ecuación (1.7), sino que está en función del cuadrado de la velocidad. Si éste 
fuera el caso, las soluciones analíticas y numéricas obtenidas en el primer capítulo serían falsas 
debido al error en la formulación. En algunas aplicaciones de ingeniería del libro se presentan con- 
sideraciones adicionales a los errores de formulación. Se debe estar consciente de estos problemas 
y darse cuenta de que, si se está usando un modelo deficiente, ningún método numérico generará los 
resultados adecuados. 


4.4.3 Incertidumbre en los datos 


Algunas veces se introducen errores en un análisis debido a la incertidumbre en los datos físicos 
obtenidos, sobre los que se basa el modelo. Por ejemplo, suponga que se desea probar el modelo de 
la caída del paracaidista, haciendo que un individuo salte repetidas veces, midiendo su velocidad 
después de un intervalo de tiempo específico. Sin duda, se asociaría cada medición con una incer- 
tidumbre, ya que el paracaidista caerá con más rapidez en unos saltos que en otros. Estos errores 
pueden mostrar inexactitud e imprecisión. Si los instrumentos constantemente subevalúan o sobre- 
valúan las mediciones de la velocidad, se estará tratando con un instrumento inexacto o desviado. 
Por otro lado, si las medidas son aleatoriamente grandes y pequeñas, entonces se trata de una cues- 
tión de precisión. 

Los errores de medición se pueden cuantificar resumiendo los datos con uno o más estadísticos, 
que den tanta información como sea posible, respecto a características específicas de los datos. 
Tales estadísticos descriptivos a menudo se seleccionan para obtener 1) la posición del centro de la 
distribución de los datos y 2) el grado de dispersión de los datos. Como tales, estos estadísticos 
ofrecen una medida de la desviación e imprecisión, respectivamente. En la parte cinco se regresa el 
tema de caracterización de incertidumbre de datos. 

Aunque se debe estar consciente de los errores por equivocación, de los errores de formulación 
y de la incertidumbre en los datos, los métodos numéricos utilizados para construir modelos pueden 
estudiarse, en la mayoría de los casos, en forma independiente de estos errores. Por consiguiente, en 
la mayor parte de este libro se supondrá que no hay errores por equivocaciones, que el modelo es 
adecuado y que se está trabajando sin errores en las mediciones de los datos. En estas condiciones 
es posible estudiar los métodos numéricos sin complicaciones. 
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PROBLEMAS 


4.1 La serie infinita se utiliza para aproximar e”: 
A Y x y" 
e =1+x+>+ Poo-+ 
2 3 n! 


a) Muestre que la expansión en serie de Maclaurin es un caso 
especial de la expansión en la serie de Taylor [ecuación (4.7)] 
conx,=0yh=x. 

b) Use la serie de Taylor para estimar f(x) = e * en x,,, = 1 para x,= 
0.2. Emplee versiones de cero, primero, segundo y tercer orden, 
y calcule le] para cada caso. 


4.2 La expansión en serie de Maclaurin para cos x es 


EA 


cosx=1-—+ L— 


2 41 6181 


Iniciando con el primer término cos x= 1, agregue los términos uno 
a uno para estimar cos(71/3). Después de que agregue cada uno de los 
términos, calcule los errores relativos porcentuales verdaderos y 
aproximados. Use una calculadora para determinar el valor exacto. 
Agregue términos hasta que el valor absoluto del error aproximado 
se encuentre dentro de cierto criterio de error, considerando dos cifras 
significativas. 

4.3 Repita los cálculos del problema 4.2, pero ahora usando la ex- 
pansión de la serie de Maclaurin para sen x, para evaluar el sen(7/3). 

3 e x 
sen x= xXx a ÓN 

4.4 La expansión de la serie de Maclaurin para la arcotangente de x 
se define para |x| < 1 como 
00 ( 2 1 y 
arctan x= 2 2 El 


qn tl 


a) Escriba los primeros cuatro términos (n = 0...3). 

b) Comenzando con la versión más simple, arctan x= x, agregue 
términos, uno a la vez, para estimar arctan(s/6). Después de 
agregar cada nuevo término, calcule los errores porcentuales 
relativos verdaderos y aproximados. Use su calculadora para 
determinar el valor exacto. Agregue términos hasta que el valor 
absoluto del estimado de error aproximado caiga por debajo de 
un criterio de error ajustado a dos cifras significativas. 

4.5 Emplee la expansión de la serie de Taylor de cero hasta tercer 
orden para predecir f(3) si 


FG) =25x — 61? + 7x— 88 


usando como punto base x= 1. Calcule el error relativo porcentual 
verdadero e, para cada aproximación. 

4.6 Use la expansión de la serie de Taylor de cero al cuarto orden 
para estimar f(2.5) si f(x) = In x utilizando x = 1 como punto base. 
Calcule el error relativo porcentual verdadero e, para cada aproxima- 
ción. Analice los resultados. 

4.7 Utilice aproximaciones en diferencias de O(h) hacia atrás y hacia 
adelante y una aproximación de diferencia central de O(/?) para es- 
timar la primera derivada de la función mencionada en el problema 
4.5. Evalúe la derivada en x = 2 usando un tamaño del incremento h 
= 0.2. Compare los resultados con el valor exacto de las derivadas. 
Interprete los resultados considerando el término residual de la ex- 
pansión en la serie de Taylor. 

4.8 Con la aproximación en diferencias centrales de O(h?) estime la 
segunda derivada de la función examinada en el problema 4.5. Rea- 


lice la evaluación para x = 2 usando un tamaño de incremento h = 
0.25 y 0.125. Compare lo estimado con el valor exacto de la segunda 
derivada. Interprete sus resultados considerando el término residual 
de la expansión en la serie de Taylor. 

4.9 La ley de Stefan-Boltzmann se utiliza para estimar la tasa de 
radiación de energía H desde una superficie, esto es, 


H=AeoT* 


donde H está en watts, A = área de la superficie (m?), e = la emisivi- 
dad que caracteriza la propiedad de emisión de la superficie (adimen- 
sional), dG = una constante universal llamada constante de 
Stefan-Boltzmann (= 5.67 x 10% W m? K*) y T= temperatura ab- 
soluta (K). Determine el error de A para una placa de acero con A = 
0.15 m? e=0.90 y T= 650 + 20. Compare los resultados con el error 
exacto. Repita los cálculos pero con T= 650 + 40. Interprete los re- 
sultados. 

4.10 Repita el problema 4.9, pero para una esfera de cobre con radio 
= 0.15 + 0.01 m, e=0.90 + 0.05 y T=550 +20. 

4.11 Recuerde que la velocidad de caída del paracaidista puede 
calcularse con [ecuación (1.10)] 


v(t) pa 24 ¿rx 
C 


Use un análisis de error de primer orden para estimar el error de v 
para f=6, si g=9.81 ym= 50, peroc=12.5+1.5. 

4.12 Repita el problema 4.11 con g=9.8,£=6,c=12.5+1.5 ym 
=50+2. 

4.13 Evalúe e interprete los números de condición para 


a fo=,lx-1]+1 


para x= 1.00001 


by) foao=e” para x=10 
Cc) fo)=WVx +1-x para x = 300 
d) ; e*-1 ES 
fa)= para x= 0.001 
x 
e) fo). E para x= 1.000177 
1+ cos x 


4.14 Empleando las ideas de la sección 4.2, muestre las relaciones 
de la tabla 4.3. 

4.15 Muestre que la ecuación (4.4) es exacta para todos los valores 
de x, si f(x) = ax? +bx+c. 

4.16 La fórmula de Manning para un canal rectangular se escribe 
como 

1 (GB yO 


O Em” 


donde O = flujo (m/s), n = coeficiente de rugosidad, B = ancho (m), 
BH = profundidad (m) y S = pendiente. Aplique la fórmula para un 
arroyo donde se conoce que el ancho = 20 m y la profundidad = 0.3 
m. Por desgracia conocemos el coeficiente de rugosidad y la pendien- 
te con una precisión de sólo +10%. Es decir, la rugosidad tiene un 
valor de 0.03 con un rango de 0.027 a 0.033, y la pendiente es 0.0003 
con un rango de 0.00027 a 0.00033. Use un análisis de error de primer 
orden para determinar la sensibilidad en la predicción del flujo para 
cada uno de esos dos factores. ¿Cuál variable se debería intentar medir 
para una mejor precisión? 


4.17 Si |x| < 1, se sabe que 
1 2 
=l+x+ + e 
l-x 


Repita el problema 4.1 para esta serie con x= 0.1. 

4.18 Un misil sale de la Tierra con una velocidad inicial v, formando 
con la vertical un ángulo p, como se muestra en la figura P4.18. La 
altitud máxima deseada es AR, donde R es el radio de la Tierra. Usan- 
do las leyes de la mecánica se demuestra que 


send, =(1+0%) ez) 


+0 


donde v, es la velocidad de escape del misil. Se quiere disparar el 
misil y alcanzar la velocidad máxima proyectada con una exactitud de 
+2%. Determine el rango de valores de p, si v,/v, =2 y Y: = 0.25. 


y 


Figura P4.18 
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4.19 Para calcular las coordenadas espaciales de un planeta tenemos 
que resolver la función 


FO) =x-1-—0.5 sen x 


Sea a = x, = 7/2 en el intervalo [0O, 71] el punto base. Determine la 
expansión de la serie de Taylor de orden superior que da un error 
máximo de 0.015 en el intervalo dado. El error es igual al valor ab- 
soluto de la diferencia entre la función dada y la expansión de la 
serie de Taylor especificada. (Sugerencia: Resuelva gráficamente.) 
4.20 Considere la función f(x) = x" — 2x + 4 en el intervalo [-2, 2] 
con h = 0.25. Use las aproximaciones en diferencias finitas hacia 
adelante, hacia atrás y centrada para la primera y segunda derivadas, 
e ilustre gráficamente qué aproximación es más exacta. Grafique las 
tres aproximaciones a la primera derivada por diferencias finitas, 
junto con los valores exactos, y haga lo mismo con la segunda deri- 
vada. 

4.21 Derive la ecuación (4.31). 

4.22 Repita el ejemplo 4.8 pero para f(x) = cos(x) en x = 0/6. 

4.23 Repita el ejemplo 4.8, pero con diferencias divididas hacia 
adelante [ecuación (4.17)]. 

4.24 Desarrolle un programa bien estructurado para calcular la ex- 
pansión de la serie de Maclaurin para la función coseno como se 
describe en el problema 4.2. La función debe tener las siguientes 
características: 

+ Itere hasta que el error relativo caiga por debajo de un criterio 
de detención (es) o exceda un número máximo de iteraciones 
(max it). Permita que el usuario especifique valores para estos 
parámetros. 

» Incluya valores por defecto de es (= 0.000001) y maxit 
(= 100) en caso de que no sean especificados por el usuario. 

» Regrese el estimado de cos(x), el valor relativo aproximado, el 
número de iteraciones y el valor relativo verdadero (que usted 
puede calcular con base en la función coseno interconstruida). 


EPÍLOGO: PARTE UNO 


PT1.4 ALTERNATIVAS 


Los métodos numéricos son científicos en el sentido de que representan técnicas sistemáticas para 
resolver problemas matemáticos. Sin embargo, hay cierto grado de arte, juicios subjetivos y conve- 
niencias, relacionadas con su uso efectivo en la ingeniería práctica. Para cada problema, se enfrenta 
uno con varios métodos numéricos alternativos y con muchos tipos diferentes de computadoras. Así, 
la elegancia y la eficiencia de las diferentes maneras de abordar los problemas varían de una perso- 
na a otra y se correlacionan con la habilidad de hacer una elección prudente. Por desgracia, como 
sucede con cualquier proceso intuitivo, los factores que influyen en dicha elección son difíciles de 
comunicar. Estas habilidades pueden descubrirse y desarrollarse sólo mediante la experiencia. Como 
tales habilidades desempeñan un papel muy importante en el uso efectivo de los métodos, se presen- 
ta esta sección como una introducción a algunas de las alternativas que se deben considerar cuando 
se seleccione un método numérico y las herramientas para su realización. Se espera que el siguiente 
análisis influencie su orientación cuando estudie el material subsecuente. También, que usted con- 
sulte nuevamente el material cuando enfrente distintas alternativas en el resto del libro. 


1. Tipo de problema matemático. Como se definió previamente en la figura PT. 1.2, en este libro se 
analizan varios tipos de problemas matemáticos. 


a) Raíces de ecuaciones. 

b) Sistemas de ecuaciones algebraicas lineales simultáneas. 
c) Optimización. 

d) Ajuste de curvas. 

e) Integración numérica. 

f) Ecuaciones diferenciales ordinarias. 

£g) Ecuaciones diferenciales parciales. 


Probablemente el lector se encontrará con algunos aspectos básicos sobre la aplicación de 
los métodos numéricos al enfrentarse con problemas específicos en algunas de esas áreas. Los 
métodos numéricos son necesarios, ya que los problemas planteados no se pueden resolver en su 
totalidad usando técnicas analíticas. Deberá estar consciente de que en las actividades profesio- 
nales se encontrarán problemas en las áreas ya mencionadas. Por lo que el estudio de los métodos 
numéricos y la selección de un equipo de cómputo deben, al menos, considerar esos tipos de 
problemas básicos. Problemas más avanzados quizá requieran de capacidades en otras áreas como 
la aproximación funcional, las ecuaciones integrales, etc. Estas áreas requieren de una gran po- 
tencia computacional o de métodos avanzados que no se cubren en este texto. Se recomienda 
consultar algunas referencias como Carnahan, Luther y Wilkes (1969); Hamming (1973); Ralston 
y Rabinowitz (1978); Burden y Faires (2005), y Moler (2004) para problemas que van más allá 
del contenido de este libro. Además, al final de cada parte de este texto se ofrece un resumen y 
las referencias para los métodos numéricos avanzados con la finalidad de encauzar al lector en 
el estudio de este tipo de métodos numéricos. 

2. Tipo, disponibilidad, precisión, costo y velocidad de una computadora. Se puede tener la oportu- 
nidad de trabajar con varias herramientas de cómputo, que van desde una calculadora de bolsillo 
hasta una supercomputadora. Cualquiera de estas herramientas se puede usar para implementar 
un método numérico (incluyendo simple papel y lápiz). En general, no se trata de extremar la 
capacidad, sino más bien evaluar costo, conveniencia, velocidad, seguridad, exactitud y precisión. 
Aunque cada una de las herramientas seguirán teniendo utilidad, los grandes avances recientes 
en el funcionamiento de las computadoras personales han tenido un gran impacto en la profesión 
del ingeniero. Se espera que esta revolución siga extendiéndose conforme continúen los avances 
tecnológicos, ya que las computadoras personales ofrecen una excelente combinación de con- 
veniencia, costo, precisión, velocidad y capacidad de almacenamiento. Más aún, se pueden usar 
fácilmente en la mayoría de los problemas prácticos de ingeniería. 


3. 


PT1.4 Alternativas 


Costo de desarrollo de programas contra costo de software contra costo de tiempo de ejecución. 
Una vez que los tipos de problemas matemáticos que deberán resolverse se hayan identificado y 
el sistema de cómputo se haya seleccionado, se considerarán los costos del software y del tiempo 
de ejecución. El desarrollo de software llega a representar un trabajo adicional en muchos pro- 
yectos de ingeniería y, por lo tanto, tener un costo sustancial. A este respecto, es importante que 
conozca bien los aspectos teóricos y prácticos de los métodos numéricos relevantes. Además, 
debe familiarizarse con el desarrollo del software profesional. Existe software de bajo costo 
disponible para implementar métodos numéricos, el cual es fácilmente adaptado a una amplia 
variedad de problemas. 

Características de los métodos numéricos. Si el costo de una computadora y de sus programas 
es alto, o si la disponibilidad de la computadora es limitada (por ejemplo, en sistemas de tiempo 
compartido), la manera de escoger cuidadosamente el método numérico ayudará a adaptarse a 
tal situación. Por otro lado, si el problema aún se encuentra en una etapa experimental, donde el 
acceso y el costo de una computadora no presenta problemas, entonces es posible seleccionar un 
método numérico que siempre trabaje, aunque quizá no sea, computacionalmente hablando, el 
más eficiente. Los métodos numéricos disponibles para resolver un tipo particular de problema 
implican todos los factores mencionados, además de: 


a) Número de condiciones iniciales o de puntos de partida. Algunos de los métodos numéricos 
para encontrar raíces de ecuaciones, o para la solución de ecuaciones diferenciales, requieren 
que el usuario especifique las condiciones iniciales o puntos de partida. Los métodos simples 
requieren en general de un valor, mientras que los métodos complicados tal vez requieran 
más de un valor. Las ventajas de los métodos complicados, que son computacionalmente 
eficientes, llegan a compensar requerimientos de puntos de partida múltiples. Debe echar 
mano de su experiencia y buen juicio para estimar las alternativas que tomará en cada pro- 
blema en particular. 

b) Velocidad de la convergencia. Ciertos métodos numéricos convergen más rápido que otros. 
No obstante, la convergencia rápida puede requerir de puntos iniciales más adecuados y de 
programación más compleja, que un método donde la convergencia es lenta. De nueva cuenta 
deberá usar su propio criterio y la experiencia para seleccionar el método. ¡Lo más rápido 
no siempre es lo mejor! 

c) Estabilidad. Algunos métodos numéricos usados para encontrar raíces de ecuaciones o para 
resolver sistemas de ecuaciones lineales llegan a diverger en vez de converger a la respuesta 
correcta. ¿Por qué existe esta posibilidad al enfrentarse con problemas de diseño o de planea- 
ción? La respuesta es que tales métodos pueden ser altamente eficientes para determinados 
problemas; por lo tanto, surgen de nuevo las alternativas. Deben decidir si las condiciones 
del problema justifican el empleo de un método que quizá no siempre converge. 

d) Exactitud y precisión. Algunos de los métodos numéricos son más exactos y precisos que 
otros. Como ejemplo se tienen las diferentes ecuaciones usadas en la integración numérica. En 
general, es posible mejorar el funcionamiento de un método de poca exactitud disminuyendo 
el tamaño del incremento o aumentando el número de aplicaciones en un intervalo dado. 
¿Resultará mejor usar un método poco exacto con un tamaño de incremento pequeño o un 
método de gran exactitud con un tamaño de incremento grande? La pregunta se debe analizar 
en cada caso específico, tomando en cuenta factores adicionales como el costo y la facilidad 
de programación. Además, se deben tomar en consideración los errores de redondeo cuando 
se utilizan métodos de baja exactitud en forma repetida, y cuando la cantidad de cálculos es 
grande. Aquí, el número de cifras significativas empleadas por la computadora llega a ser el 
factor decisivo. 

e) Gama de aplicaciones. Algunos métodos numéricos se aplican sólo a ciertas clases de pro- 
blemas o a problemas que satisfacen ciertas restricciones matemáticas. Otros métodos no 
se ven afectados por estas restricciones. Entonces, deberá evaluar si vale la pena desarrollar 
programas que emplean técnicas apropiadas únicamente para un número limitado de pro- 
blemas. El hecho de que tales técnicas sean ampliamente usadas indica que tienen ventajas 
que a menudo superan a las desventajas. De hecho es necesario evaluar las alternativas. 
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Epílogo: parte uno 


f) Requisitos especiales. Algunas técnicas numéricas tratan de incrementar la exactitud y la 
velocidad de convergencia usando información especial o adicional. Un ejemplo sería el uso 
de valores estimados o teóricos de errores que permiten mejorar la exactitud. Sin embargo, 
estas mejorías, en general, no se logran sin algunos inconvenientes, como mayores costos 
computacionales o el incremento en la complejidad del programa. 

8) Esfuerzo de programación necesario. Los esfuerzos para mejorar la velocidad de convergen- 
cia, estabilidad y exactitud pueden ser creativos e ingeniosos. Cuando se realizan mejoras sin 
aumentar la complejidad de la programación, entonces se considera que estas mejoras son 
excelentes y quizá encuentren un uso inmediato en la ingeniería. No obstante, si éstas re- 
quieren de programas más complejos, se enfrentarían a situaciones alternativas que pueden 
favorecer o no el nuevo método. 


Resulta claro que el análisis anterior relacionado con la elección de un método numérico se 
reduce sólo a costo y exactitud. Los costos son los del tiempo de cómputo y el desarrollo de 
programas. La exactitud apropiada es una cuestión de ética y de juicio profesional. 


5. Comportamiento matemático de la función, la ecuación o los datos. Al seleccionar un método 
numérico en particular, un tipo de computadora y un tipo de programas, se debe tomar en cuenta 
la complejidad de las funciones, las ecuaciones o los datos. Las ecuaciones simples y los datos 
uniformes se tratan apropiadamente mediante algoritmos numéricos simples y con computadoras 
de bajo costo. Sucede lo contrario con las ecuaciones complicadas y los datos que presentan 
discontinuidades. 

6. Facilidad de aplicación (¿amigable para el usuario?). Algunos métodos numéricos son fáciles de 
aplicar; otros son difíciles. Esto es una consideración cuando se tenga que elegir un método sobre 
otro. La misma idea se aplica a las decisiones que tienen que ver con los costos de desarrollar 
un programa versus el software desarrollado profesionalmente. Podría requerirse un esfuerzo 
considerable para convertir un programa difícil en otro que sea amigable para el usuario. En el 
capítulo 2 se introdujeron formas de hacer esto, y se emplean a lo largo del libro. 

7. Mantenimiento. Los programas para resolver problemas de ingeniería requieren de mantenimiento, 
porque durante las aplicaciones ocurren, en forma invariable, dificultades. El mantenimiento puede 
requerir un cambio en el código del programa o la expansión de la documentación. Los programas 
y los algoritmos numéricos simples son más fáciles de mantener. 


Los siguientes capítulos muestran el desarrollo de varios tipos de métodos numéricos para una va- 
riedad de problemas matemáticos. Se ofrecen, en cada capítulo, varios métodos alternativos. Se 
presentan estos métodos (en vez de un método escogido por los autores), ya que no existe uno que 
sea “el mejor” de todos. No hay métodos “mejores”, existen alternativas con ventajas y desventajas 
que se deben tomar en consideración cuando se aplica un método a un problema práctico. Al final 
de cada parte del libro, se encontrará una tabla que destaca las ventajas y desventajas inherentes a 
cada método. Esta tabla debe ayudarle a seleccionar el procedimiento numérico adecuado para el 
contexto de su problema específico. 


PT1.5 RELACIONES Y FÓRMULAS IMPORTANTES 


En la tabla PT1.2 se resume información importante que se presentó en la parte uno. La tabla es útil 
para tener un acceso rápido a las relaciones y fórmulas más importantes. El epílogo de cada parte 
del libro contiene un resumen como éste. 


PT1.6 MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES 


El epílogo de cada parte del libro también incluye una sección diseñada para facilitar y fomentar el 
estudio de métodos numéricos adicionales. Dicha sección proporciona algunas referencias de otros 
libros sobre el tema, así como de material relacionado con métodos más avanzados.' 


! Aquí, los libros se referencian sólo por autor. Al final del texto se incluye una bibliografía completa. 


PT1.6 Métodos avanzados y referencias adicionales 


Tabla PT1.2 Resumen de información importante presentada en la parte uno. 


Definiciones de error 


Error verdadero E, = valor verdadero — valor aproximado 


valor verdadero — valor aproximado 
valor verdadero 


Error relativo porcentual verdadero E, 100% 


aproximación presente — aproximación anterior 
pet p P 100% 


Error relativo porcentual aproximado a aproximación presente 
Criterio de paro Terminar los cálculos cuando 
€, < 8, 


donde e, es el error relativo porcentual deseado 


Serie de Taylor 


Fx 
Expansión de la serie de Taylor Xi) = Ax) +P (ha > 0 
m (n) 
y 26) y, hoy d 26) yn HR, 
3! n! 
donde 
(n+1) 
Residuo R,= y O pra 
(n+1 
o 
R,=0(h"") 


Diferenciación numérica 


PX) — Ax) 


Primera diferencia finita dividida hacia delante f'(x;,)= +0(h) 


(Otras diferencias divididas se resumen en los capítulos 4 y 23.) 


Propagación del error 


Para n variables independientes x,, X>,..., X, Con errores AX,, AX,,... AX,, el error en la función f se estima mediante 


of 
ox; 


of 
ox, 


of 
OXn 


q 7 


Af AX, +--+ AX 


n 


Para ampliar los antecedentes mencionados en la parte uno, existen diversos manuales sobre 
programación. Sería difícil mencionar todos los excelentes libros y manuales que corresponden a 
lenguajes y computadoras específicos. Además quizá ya se tenga material sobre estudios previos de 
la programación. No obstante, si ésta es su primera experiencia con computadoras, el profesor o sus 
compañeros de semestre avanzados le darían al usuario recomendaciones acerca de las bibliografías 
para las máquinas y los lenguajes disponibles en su escuela. 

Para el análisis de errores, cualquier buen libro de introducción al cálculo incluirá material 
complementario relacionado, tal como las series de Taylor. Las obras de Swokowski (1979), Thomas 
y Finney (1979), y Simmons (1985) ofrecen una teoría comprensible de estos temas. Taylor (1982), 
además, presenta una excelente introducción al análisis del error. 

Finalmente, aunque esperamos que nuestro libro le sea útil, es siempre bueno consultar otras 
fuentes cuando trate de dominar un nuevo tema. Burden y Faires (2005); Ralston y Rabinowitz (1978); 
Hoffman (1992), y Carnahan, Luther y Wilkes (1969) proporcionan explicaciones amplias de la ma- 
yoría de métodos numéricos. Otros excelentes libros sobre este tema son Gerald y Wheatley (2004), 
y Cheney y Kincaid (2008). Además, Press et al. (2007) incluyen algoritmos para implementar diver- 
sos métodos, y Moler (2004) y Chapra (2007) versan sobre métodos numéricos con MATLAB. 


89 


PARTE. DOS 


AA 


RAÍCES DE ECUACIONES 


PT2.1 MOTIVACIÓN 


Desde hace años usted aprendió a usar la fórmula cuadrática: 


_—bExb*-4ac 


x PT2.1 
24 ( ) 
para resolver 
fo) =aé+bx+c=0 (PT2.2) 


A los valores calculados con la ecuación (PT2.1) se les llama las “raíces” de la ecuación (PT2.2), 
que representan los valores de x que hacen a la ecuación (PT2.2) igual a cero. Por lo tanto, se define 
la raíz de una ecuación como el valor de x que hace f(x) = 0. Debido a esto, algunas veces a las raíces 
se les conoce como ceros de la ecuación. 

Aunque la fórmula cuadrática es útil para resolver la ecuación (PT2.2), existen muchas funcio- 
nes donde las raíces no se pueden determinar tan fácilmente. En estos casos, los métodos numéricos 
descritos en los capítulos 5, 6 y 7 proporcionan medios eficientes para obtener la respuesta. 


PT2.1.1 Métodos para la determinación de raíces sin emplear computadoras 


Antes de la llegada de las computadoras digitales se disponía de una serie de métodos para encontrar 
las raíces de ecuaciones algebraicas y trascendentes. En algunos casos, las raíces se obtenían con 
métodos directos, como se hace con la ecuación (PT2.1). Sin embargo existen ecuaciones como ésta 
que se resuelven directamente y aparecen muchas más en las que no es posible encontrar su solución. 
Por ejemplo, incluso una función tan simple como f(x) = e* — x no se puede resolver en forma ana- 
lítica. En tales casos, la única alternativa es una técnica con solución aproximada. 

Un método para obtener una solución aproximada consiste en graficar la función y determinar 
dónde cruza el eje de las x. Este punto, que representa el valor de x para el cual f(x) = 0, es la raíz. Las 
técnicas gráficas se exponen al principio de los capítulos 5 y 6. 

Aunque los métodos gráficos son útiles en la obtención de estimaciones de las raíces, tienen el 
inconveniente de que son poco precisos. Un método alternativo es el de prueba y error. Esta “técni- 
ca” consiste en elegir un valor de x y evaluar si f(x) es cero. Si no es así (como sucederá en la mayo- 
ría de los casos) se hace otra elección y se evalúa nuevamente f(x) para determinar si el nuevo valor 
ofrece una mejor aproximación de la raíz. El proceso se repite hasta que se obtenga un valor que 
proporcione una f(x) cercana a cero. 

Estos métodos fortuitos, evidentemente, son ineficientes e inadecuados para las exigencias 
de la ingeniería. Las técnicas descritas en la parte dos representan alternativas que no sólo aproxi- 
man sino que emplean estrategias sistemáticas para dirigirse a la raíz verdadera. Tal como se 
presenta en las páginas siguientes, la combinación de estos métodos sistemáticos con la compu- 
tadora hacen que la solución de la mayoría de los problemas de raíces de ecuaciones sea una 
tarea sencilla y eficiente. 


PT2.1.2 Raíces de ecuaciones y la práctica en ingeniería 


Aunque las raíces de ecuaciones aparecen en el contexto de diversos problemas, son frecuentes en 
el área de diseño en ingeniería. En la tabla PT2.1 se muestra un conjunto de principios fundamenta- 
les que se utilizan comúnmente en trabajos de diseño. Como se expuso en el capítulo 1, las ecuacio- 
nes matemáticas o modelos provenientes de estos principios se utilizan para predecir los valores de 
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variables dependientes en función de variables independientes y los valores de parámetros. Obser- 
ve que en cada caso las variables dependientes representan el estado o desempeño del sistema; 
mientras que los parámetros representan sus propiedades o su composición. 

Un ejemplo de tales modelos es la ecuación obtenida a partir de la segunda ley de Newton, 
usada en el capítulo 1 para la velocidad del paracaidista: 


a (PT2.3) 
C 


donde la velocidad v= la variable dependiente, el tiempo £= la variable independiente, la constante 
de gravitación g = una función de fuerza y el coeficiente de resistencia c y la masa m son los pará- 
metros. Si se conocen los parámetros, la ecuación (PT2.3) se utiliza para predecir la velocidad del 
paracaidista como una función del tiempo. Estos cálculos se pueden llevar a cabo de manera direc- 
ta, ya que u se expresa explícitamente como una función del tiempo. Es decir, queda despejada en 
el lado izquierdo del signo igual. 

No obstante, suponga que se tiene que determinar el coeficiente de resistencia de un paracaidis- 
ta con una masa dada, para alcanzar una velocidad determinada en un periodo preestablecido. Aun- 
que la ecuación (PT2.3) ofrece una representación matemática de la interrelación entre las variables 
del modelo y los parámetros, no es posible obtener explícitamente el coeficiente de resistencia. Tra- 
te de hacerlo. No hay forma de reordenar la ecuación para despejar el parámetro c. En tales casos, se 
dice que c está en forma implícita. 

Esto representa un verdadero dilema, ya que en muchos de los problemas de diseño en ingenie- 
ría hay que especificar las propiedades o la composición de un sistema (representado por sus pará- 
metros) para asegurar que esté funcionando de la manera deseada (representado por las variables). 
Así, a menudo dichos problemas requieren la determinación de parámetros implícitos. 

La solución del dilema es proporcionada por los métodos numéricos para raíces de ecuaciones. 
Para resolver el problema con métodos numéricos es conveniente reexpresar la ecuación (PT2.3), 
esto se logra restando la variable dependiente v de ambos lados de la ecuación, 


fo0= E (1-950 (PT2.4) 
Cc 


Por lo tanto, el valor de c que hace f(c) = 0 es la raíz de la ecuación. Este valor también representa 
el coeficiente de arrastre que resuelve el problema de diseño. 

En la parte dos de este libro se analiza una gran variedad de métodos numéricos y gráficos 
para determinar raíces de relaciones como en la ecuación (PT2.4). Dichas técnicas se pueden apli- 


Tabla PT2.1 Principios fundamentales usados en los problemas de ingeniería. 


Principio Variable Variable 
fundamental dependiente independiente Parámetros 
Balance de calor Temperatura Tiempo y posición Propiedades térmicas del material y 
geometría del sistema 
Balance de masa Concentración o cantidad Tiempo y posición El comportamiento químico del ma- 
de masa terial: coeficientes de transferencia 
de masa y geometría del sistema 
Balance de fuerzas Magnitud y dirección de Tiempo y posición Resistencia del material, propieda- 
fuerzas des estructurales y geometría del 
sistema 
Balance de energía Cambios en los estados Tiempo y posición Propiedades térmicas, masa del 
de energía cinética y material y geometría del sistema 
potencial de un sistema 
Leyes de Newton del Aceleración, velocidad y Tiempo y posición Masa del material, geometría del 
movimiento posición sistema y parámetros disipadores, 
como fricción y resistencia 
Leyes de Kirchhoff Corriente y voltaje en Tiempo Propiedades eléctricas del sistema, 
circuitos eléctricos como resistencia, capacitancia e 


inductancia 


PT2.3 Orientación 


car a problemas de diseño en ingeniería con base en los principios fundamentales dados en la tabla 
PT2.1, así como a muchos problemas que se encuentran de manera rutinaria en la práctica de la 
ingeniería. 


PT2.2 ANTECEDENTES MATEMÁTICOS 


En la mayoría de las áreas mencionadas en este libro existen algunos prerrequisitos matemáticos 
necesarios para dominar el tema. Por ejemplo, los conceptos de estimación del error y expansión de 
la serie de Taylor, analizados en los capítulos 3 y 4, tienen relevancia directa en nuestro estudio de las 
raíces de ecuaciones. Además, anteriormente ya se mencionaron los términos: ecuaciones “algebrai- 
cas” y “trascendentes”. Resulta útil definir formalmente dichos términos y estudiar cómo se relacio- 
nan en esta parte del libro. 

Por definición, una función dada por y = f(x) es algebraica si se expresa de la forma: 


fat y + fy+f=0 (PT2.5) 


donde f, es un polinomio de ¡-ésimo orden en x. Los polinomios son un tipo de funciones algebraicas 
que generalmente se representan como: 


f(0)=a+ax+axk+- +0,x" (PT2.6) 


n 


donde n es el grado del polinomio y las a son constantes. Algunos ejemplos específicos son: 


f0)=1-2.371+7.5 (PT2.7) 


f0)=5%-x + 7% (PT2.8) 


Las funciones trascendentes son funciones que no son algebraicas. Comprenden las funciones 
trigonométricas, las funciones exponenciales, las funciones logarítmicas y otras menos familiares. 
Algunos ejemplos son: 


f0)=Inx-1 (PT2.9) 


FO) = e" sen (3x — 0.5) (PT2.10) 


Las raíces de las ecuaciones pueden ser reales o complejas. Aunque hay algunos casos en que las 
raíces complejas de funciones no polinomiales son de interés, esta situación es menos común que en 
polinomios. En consecuencia, los métodos numéricos estándares para encontrar raíces se encuentran 
en dos áreas de problemas relacionados, pero fundamentalmente distintos: 


1. La determinación de raíces reales de ecuaciones algebraicas y trascendentes. Dichas técnicas 
se diseñaron para determinar el valor de una sola raíz real basándose en un conocimiento previo 
de su posición aproximada. 

2. La determinación de todas las raíces reales y complejas de polinomios. Estos métodos están 
diseñados especialmente para polinomios; determinan sistemáticamente todas las raíces del 
polinomio en lugar de sólo una raíz real dada una posición aproximada. 


En este libro se estudian ambas, los capítulos 5 y 6 se dedican a la primera área y el capítulo 7 
se ocupa de los polinomios. 


PT2.3 ORIENTACIÓN 


Antes de proceder con los métodos numéricos para determinar raíces de ecuaciones, será útil dar 
alguna orientación. El siguiente material intenta dar una visión general de los temas de la parte dos. 
Además, se han incluido algunos objetivos que orientarán al lector en su estudio del material. 
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PT2.3.1 Alcance y presentación preliminar 


La figura PT2.1 es una representación esquemática de la organización de la parte dos. Examine esta fi- 
gura cuidadosamente, iniciando en la parte de arriba y avanzando en el sentido de las manecillas del reloj. 

Después de la presente introducción, el capítulo 5 se dedica a los métodos cerrados, que usan 
intervalos, para encontrar raíces. Estos métodos empiezan con intervalos que encierran o contienen a 
la raíz, y después reducen sistemáticamente el tamaño del intervalo. Se estudian dos métodos específicos: 
el de bisección y el de la falsa posición. Los métodos gráficos sirven para dar una comprensión visual 
de las técnicas. Se desarrollan formulaciones del error para ayudar a determinar el trabajo computacio- 
nal que se requiere para estimar la raíz con un nivel de precisión especificado previamente. 

En el capítulo 6 se tratan los métodos abiertos. Estos métodos también emplean iteraciones 
sistemáticas de prueba y error; pero no requieren que el intervalo inicial encierre a la raíz. Se des- 
cubrirá que estos métodos, en general, son más eficientes computacionalmente que los métodos 
cerrados, aunque no siempre funcionan. Se analizan los métodos de iteración de un punto fijo, de 
Newton-Raphson y de la secante. Los métodos gráficos sirven para dar una idea geométrica en los 
casos donde los métodos abiertos no funcionan. Se desarrollan las fórmulas que proporcionan una 
idea de qué tan rápido los métodos abiertos convergen a la raíz. Se describe un enfoque avanzado, 
el método de Brent, que combina la confiabilidad del uso de métodos cerrados con la rapidez de los 
métodos abiertos. Además, se explica la forma de extender el método de Newton-Raphson para 
sistemas de ecuaciones no lineales. 

El capítulo 7 está dedicado a encontrar las raíces de polinomios. Después de las secciones an- 
teriores sobre polinomios, se estudian los métodos convencionales (en particular los métodos abier- 
tos del capítulo 6). Se describen dos métodos especiales para localizar raíces de polinomios: los 
métodos de Múiller y Bairstow. El capítulo termina con información acerca de la búsqueda de raíces 
con Excel, MATLAB y Mathcad. 

En el capítulo 8 se extienden los conceptos anteriores a los problemas reales de ingeniería. Se 
emplean aplicaciones a la ingeniería para ilustrar las ventajas y desventajas de cada uno de los mé- 
todos, proporcionando una visión de cómo se aplican las técnicas en la práctica profesional. Las 
aplicaciones también destacan las alternativas (estudiadas en la parte uno) asociadas con cada uno 
de los métodos. 

Se incluye un epílogo al final de la parte dos. Éste contiene una detallada comparación de los 
métodos analizados en los capítulos 5, 6 y 7. Esta comparación comprende una descripción de las al- 
ternativas relacionadas con el uso apropiado de cada técnica. Esta sección proporciona también un 
resumen de las fórmulas importantes, junto con referencias para algunos de los métodos que van 
más allá del alcance de este texto. 


PT2.3.2 Metas y objetivos 


Objetivos de estudio Después de terminar la parte dos usted debe tener la suficiente información 
para abordar con éxito una amplia variedad de problemas de ingeniería, relacionados con las raíces 
de ecuaciones. En general, ya dominará las técnicas, ya habrá aprendido a determinar su confiabi- 
lidad y tendrá la capacidad de elegir el mejor método (o métodos) para cualquier problema particu- 
lar. Además de estas metas generales, deberá haber asimilado los conceptos específicos de la tabla 
PT2.2 para comprender mejor el material de la parte dos. 


Objetivos de cómputo El libro proporciona software y algoritmos sencillos para implementar 
las técnicas analizadas en la parte dos. Todos tienen utilidad como herramientas del aprendizaje. 

Se presentan directamente pseudocódigos para varios métodos en el texto. Esta información le 
permitirá ampliar su biblioteca de software para contar con programas que son más eficientes que 
el método de bisección. Por ejemplo, tal vez usted desee tener sus propios programas para las técni- 
cas de la falsa posición, de Newton-Raphson y de secante, las cuales a menudo son más eficientes 
que el método de bisección. 

Finalmente, los paquetes de software como Excel, MATLAB y Mathcad tienen poderosas ca- 
pacidades para localizar raíces. Puede usar esta parte del libro para empezar a familiarizarse con 
estas capacidades. 
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Tabla PT2.2 Objetivos específicos de estudio de la parte dos. 


10. 


11. 


Comprender la interpretación gráfica de una raíz 

Conocer la interpretación gráfica del método de falsa posición y por qué, en general, es mejor que el método 
de bisección 

Entender la diferencia entre los métodos cerrados y los métodos abiertos para la localización de las raíces 
Entender los conceptos de convergencia y de divergencia; usar el método gráfico de las dos curvas para tener 
una idea visual de los conceptos 

Saber por qué los métodos cerrados siempre convergen, mientras que los métodos abiertos algunas veces 
pueden diverger 

Observar que la convergencia en los métodos abiertos es más segura si el valor inicial está cercano a la raíz 
verdadera 

Entender los conceptos de convergencia lineal y cuadrática, así como sus implicaciones en la eficiencia de los 
métodos de iteración de punto fijo y de Newton-Raphson 

Conocer las diferencias fundamentales entre el método de la falsa posición y el método de la secante, y cómo 
se relacionan con la convergencia 

Entender cómo el método de Brent combina la confiabilidad de la bisección con la rapidez de los métodos 
abiertos 

Comprender los problemas que presentan raíces múltiples y las modificaciones que se pueden hacer para 
reducir dichos problemas 

Saber cómo extender el método de Newton-Raphson de una sola ecuación no lineal con el propósito de 
resolver sistemas de ecuaciones no lineales 
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Figura PT2.1 
Esquema de la organi- 
zación del material de 
la parte dos: Raíces 
de ecuaciones. 


AS E y 


Métodos cerrados 


Este capítulo sobre raíces de ecuaciones se ocupa de métodos que aprovechan el hecho de que una 
función cambia de signo en la vecindad de una raíz. A estas técnicas se les llama métodos cerrados, 
o de intervalos, porque se necesita de dos valores iniciales para la raíz. Como su nombre lo indica, 
dichos valores iniciales deben “encerrar”, o estar a ambos lados de la raíz. Los métodos particulares 
descritos aquí emplean diferentes estrategias para reducir sistemáticamente el tamaño del intervalo 
y así converger a la respuesta correcta. 

Como preámbulo de estas técnicas se analizarán los métodos gráficos para representar tanto las 
funciones como sus raíces. Además de la utilidad de los métodos gráficos para determinar valores 
iniciales, también son útiles para visualizar las propiedades de las funciones y el comportamiento 
de los diversos métodos numéricos. 


5.1 MÉTODOS GRÁFICOS 


Un método simple para obtener una aproximación a la raíz de la ecuación f(x) = 0 consiste en grafi- 
car la función y observar dónde cruza el eje x. Este punto, que representa el valor de x para el cual 
FG) = 0, ofrece una aproximación inicial de la raíz. 


EJEMPLO 5.1 El método gráfico 
Planteamiento del problema Utilice el método gráfico para determinar el coeficiente de re- 
sistencia c necesario para que un paracaidista de masa m = 68.1 kg tenga una velocidad de 40 m/s 


después de una caída libre de += 10 s. Nota: La aceleración de la gravedad es de 9.81 m/s?. 


Solución Este problema se resuelve determinando la raíz de la ecuación (PT2.4) usando los pa- 
rámetros £= 10, g =9.81, v=40 y m= 68.1: 


10) pe 9.81(68.1) (1 _ ¿eE -A0 
C 
0) 
Fc) = nO ip (lg 1590).40) (E5.1.1) 
C 


Diversos valores de c pueden sustituirse en el lado derecho de esta ecuación para calcular (ver 
tabla de la figura 5.1). 


Estos puntos se grafican en la figura 5.1. La curva resultante cruza el eje c entre 12 y 16. Un vistazo 
a la gráfica proporciona una aproximación a la raíz de 14.75. La validez de la aproximación visual 
se verifica sustituyendo su valor en la ecuación (E5.1.1) para obtener 


668.06 
14.75 


£(4.75)= (1 — (791168630475) _ 40 =0.100 


que está cercano a cero. También se verifica por sustitución en la ecuación (PT2.3) junto con el 
valor de los parámetros de este ejemplo para dar 


5.1 Métodos gráficos 


Fc) 4 e EU ES paramo = 40.100 
14.75 
40 
que es muy cercano a la velocidad de caída deseada de 40 m/s. 
A c f(c) 
4 34.190 
8 17.712 
20H 12 6.114 
16 -2.230 
20 -8.368 
0 
Figura 5.1 
0 El método gráfico para determinar las raíces de una ecuación. 


Las técnicas gráficas tienen un valor práctico limitado, ya que no son precisas. Sin embargo, los 
métodos gráficos se utilizan para obtener aproximaciones de la raíz. Dichas aproximaciones se 
pueden usar como valores iniciales en los métodos numéricos analizados en este capítulo y en el 
siguiente. 

Las interpretaciones gráficas, además de proporcionar estimaciones de la raíz, son herramien- 
tas importantes en la comprensión de las propiedades de las funciones y en la prevención de las 
fallas de los métodos numéricos. Por ejemplo, la figura 5.2 muestra algunas de las formas en las que 
la raíz puede encontrarse (o no encontrarse) en un intervalo definido por un límite inferior x, y un 
límite superior x,. La figura 5.2b representa el caso en que una sola raíz está acotada por los valores 
positivo y negativo de f(x). Sin embargo, la figura 5.2d, donde f(x,) y f(x, ) están también en lados 
opuestos del eje x, muestra tres raíces que se presentan en ese intervalo. En general, si f(x) y f(x.) 
tienen signos opuestos, existe un número impar de raíces en el intervalo. Como se indica en las fi- 
guras 5.2a y c, si f(x) y f(x, ) tienen el mismo signo, no hay raíces o hay un número par de ellas 
entre los valores. 

Aunque dichas generalizaciones son usualmente verdaderas, existen casos en que no se cumplen. 
Por ejemplo, las funciones tangenciales al eje x (figura 5.3a) y las funciones discontinuas (figura 
5.3b) pueden violar estos principios. Un ejemplo de una función que es tangencial al eje x es la 
ecuación cúbica f(x) = (x — 2)(x — 2)(x — 4). Observe que cuando x = 2, dos términos en este polino- 
mio son iguales a cero. Matemáticamente, x =2 se llama una raíz múltiple. Al final del capítulo 6 
se presentan técnicas que están diseñadas expresamente para localizar raíces múltiples. 

La existencia de casos del tipo mostrado en la figura 5.3 dificulta el desarrollo de algoritmos 
generales para computadoras que garanticen la ubicación de todas las raíces en el intervalo. Sin 
embargo, cuando se usan los métodos expuestos en las siguientes secciones en conjunción con los 
métodos gráficos, resultan de gran utilidad para buscar muchas raíces en problemas de ecuaciones 
que se presentan rutinariamente en la ingeniería y en las matemáticas aplicadas. 


EJEMPLO 5.2 Uso de gráficas por computadora para localizar raíces 


Planteamiento del problema Las gráficas por computadora facilitan y mejoran la localización 
de las raíces de una ecuación. La función 


f—c) = sen 10x + cos 3x 
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Figura 5.2 

Ilustración de las formas generales en que puede ocurrir una raíz en un 
intervalo preescrito por los límites inferior x, y superior x,. Las figuras a) y 
c) muestran que si f(x, y f(x) tienen el mismo signo, entonces no habrá 
raíces dentro del intervalo o habrá un número par de ellas. Las figuras 
b) y d) muestran que si la función tiene signos diferentes en los puntos 
extremos, entonces habrá un número impar de raíces dentro del inter- 
valo. 


FE) 


FA 


l I 20 
l 0 l 
Fo) 
l 26 
b) 


FE) 


Y 


a) 


*y 


E ON 


FE) 


Figura 5.3 

Ilustración de algunas excepciones a los casos generales mostrados 
en la figura 5.2. a) Pueden ocurrir raíces múltiples cuando la función 
es tangencial el eje x. En este caso, aunque los puntos extremos son 
de signos opuestos, hay un número par de intersecciones con el eje 
x en el intervalo. b) Función discontinua donde los puntos extremos 
de signo opuesto contienen un número par de raíces. Se requiere de 
estrategias especiales para determinar las raíces en estos casos. 


tiene varias raíces en el rango que va de x = 0 a x = 5. Utilice gráficas por computadora para com- 
prender mejor el comportamiento de esta función. 


Solución Para generar gráficas se usan paquetes como Excel y MATLAB. En la figura 5.4a se 
presenta la gráfica de f(x) desde x = 0 hasta x = 5. La gráfica muestra la existencia de varias raíces, 
incluyendo quizás una doble raíz alrededor de x = 4.2, donde f(x) parece ser tangente al eje x. Se 
obtiene una descripción más detallada del comportamiento de f(x) cambiando el rango de graficación, 
desde x = 3 hasta x = 5, como se muestra en la figura 5.4b. Finalmente, en la figura 5.4c, se reduce 
la escala vertical, de f(x) =-0.15 a f(x) = 0.15, y la escala horizontal se reduce, de x =4.2 ax= 4,3. 
Esta gráfica muestra claramente que no existe una doble raíz en esta región y que, en efecto, hay dos 
raíces diferentes entre x = 4.23 y x= 4.26. 

Las gráficas por computadora tienen gran utilidad en el estudio de los métodos numéricos. Esta 
posibilidad también puede tener muchas aplicaciones en otras materias de la escuela, así como en 
las actividades profesionales. 


5.2 El método de bisección 


4.2 4.25 4.3 


c) 


Figura 5.4 
Amplificación progresiva de f(x) = sen 10x + cos 3x mediante la computadora. Estas gráficas interactivas 
le permiten al analista determinar que existen dos raíces distintas entre x =4.2 y x=4.3. 


5.2 EL MÉTODO DE BISECCIÓN 


Cuando se aplicaron las técnicas gráficas en el ejemplo 5.1, usted observó (figura 5.1) que f(x) cam- 
bió de signo a ambos lados de la raíz. En general, si f(x) es real y continúa en el intervalo que va 
desde x, hasta x, y f(x) y f(x, ) tienen signos opuestos, es decir, 


FG) f,) <0 (5.1) 


entonces hay al menos una raíz real entre x, y x,. 

Los métodos de búsqueda incremental aprovechan esta característica localizando un intervalo 
en el que la función cambie de signo. Entonces, la localización del cambio de signo (y, en consecuen- 
cia, de la raíz) se logra con más exactitud al dividir el intervalo en varios subintervalos. Se investiga 
cada uno de estos subintervalos para encontrar el cambio de signo. El proceso se repite y la aproxi- 
mación a la raíz mejora cada vez más en la medida que los subintervalos se dividen en intervalos 
cada vez más pequeños. Volveremos al tema de búsquedas incrementales en la sección 5.4. 

El método de bisección, conocido también como de corte binario, de partición de intervalos o 
de Bolzano, es un tipo de búsqueda incremental en el que el intervalo se divide siempre a la mitad. 
Si la función cambia de signo sobre un intervalo, se evalúa el valor de la función en el punto medio. 
La posición de la raíz se determina situándola en el punto medio del subintervalo, dentro del cual 
ocurre un cambio de signo. El proceso se repite hasta obtener una mejor aproximación. En la figura 
5.5 se presenta un algoritmo sencillo para los cálculos de la bisección. En la figura 5.6 se muestra 
una representación gráfica del método. Los siguientes ejemplos se harán a través de cálculos reales 
involucrados en el método. 
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Paso 1: Elija valores iniciales inferior, x,, y superior, x,, que encierren la raíz, de forma tal 
que la función cambie de signo en el intervalo. Esto se verifica comprobando 
que f(x) Fx.) < 0. 
Paso 2: Una aproximación de la raíz x, se determina mediante: 
X +Xy 
id = 2 
Paso 3: Realice las siguientes evaluaciones para determinar en qué subintervalo está 
la raíz: 
a) Si F(x)Ax)<0, entonces la raíz se encuentra dentro del subintervalo inferior 
o izquierdo. Por lo tanto, haga x, = X, y vuelva al paso 2. 
b) Si F(xpf(x) > O, entonces la raíz se encuentra dentro del subintervalo su- 
perior o derecho. Por lo tanto, haga x; = x, y vuelva al paso 2. 
0) Si xpñx) =0, la raíz es igual a x,; termina el cálculo. 


Figura 5.5 


EJEMPLO 5.3  Bisección 


Planteamiento del problema Emplee el método de bisección para resolver el mismo problema 
que se resolvió usando el método gráfico del ejemplo 5.1. 


Solución El primer paso del método de bisección consiste en asignar dos valores iniciales a la in- 
cógnita (en este problema, c) que den valores de f(c) con diferentes signos. En la figura 5.1 se obser- 
va que la función cambia de signo entre los valores 12 y 16. Por lo tanto, la estimación inicial de la 
raíz x, se encontrará en el punto medio del intervalo 


12+16 
Xx, = = 
2 
Dicha aproximación representa un error relativo porcentual verdadero de e, = 5.3% (note que el 
valor verdadero de la raíz es 14.8011). A continuación calculamos el producto de los valores en la 
función en un límite inferior y en el punto medio: 


FADAIA) = 6.114(1.611) = 9.850 


14 


que es mayor a cero y, por lo tanto, no ocurre cambio de signo entre el límite inferior y el punto 
medio. En consecuencia, la raíz debe estar localizada entre 14 y 16. Entonces, se crea un nuevo in- 
tervalo redefiniendo el límite inferior como 14 y determinando una nueva aproximación corregida 
de la raíz 


y, 416 6 
a 


la cual representa un error porcentual verdadero e,= 1.5%. Este proceso se repite para obtener una 
mejor aproximación. Por ejemplo, 

JAMRIS) = 1.611(-0.384) = 0.619 
Por lo tanto, la raíz está entre 14 y 15. El límite superior se redefine como 15 y la raíz estimada para 


la tercera iteración se calcula así: 


14+15 
x= = 


7 


14.5 


que representa un error relativo porcentual e, = 2.09%. Este método se repite hasta que el resultado 
sea suficientemente exacto para satisfacer sus necesidades. 


5.2 El método de bisección 


Figura 5.6 
Una representación gráfica del método de 
bisección. La gráfica presenta las primeras 
tres iteraciones del ejemplo 5.3. 


En el ejemplo anterior, se observa que el error verdadero no disminuye con cada iteración. Sin 
embargo, el intervalo donde se localiza la raíz se divide a la mitad en cada paso del proceso. Como 
se estudiará en la siguiente sección, el ancho del intervalo proporciona una estimación exacta del 
límite superior del error en el método de bisección. 


5.2.1 Criterios de paro y estimaciones de errores 


Terminamos el ejemplo 5.3 diciendo que el método se repite para obtener una aproximación más 
exacta de la raíz. Ahora debemos desarrollar un criterio objetivo para decidir cuándo debe terminar 
el método. 

Una sugerencia inicial sería finalizar el cálculo cuando el error verdadero se encuentre por deba- 
jo de algún nivel prefijado. En el ejemplo 5.3 se observa que el error relativo baja de 5.3 a 2.0% du- 
rante el procedimiento de cálculo. Podemos decidir que el método termina cuando se alcance un error 
más bajo, por ejemplo, al 0.1%. Dicha estrategia es inconveniente, ya que la estimación del error en 
el ejemplo anterior se basó en el conocimiento del valor verdadero de la raíz de la función. Éste no 
es el caso de una situación real, ya que no habría motivo para utilizar el método si conocemos la raíz. 

Por lo tanto, necesitamos estimar el error de forma tal que no se necesite el conocimiento previo 
de la raíz. Como se vio previamente en la sección 3.3, se puede calcular el error relativo porcentual 
€, de la siguiente manera [recuerde la ecuación (3.5)]: 


nuevo anterior 
r r 
nuevo 


r 


100% (5.2) 


nuevo anterior 


donde x,”""" es la raíz en la iteración actual y x, es el valor de la raíz en la iteración anterior. Se 
utiliza el valor absoluto, ya que por lo general importa sólo la magnitud de e, sin considerar su signo. 
Cuando e, es menor que un valor previamente fijado e,, termina el cálculo. 


EJEMPLO 5.4 Estimación del error en la bisección 


Planteamiento del problema Continúe con el ejemplo 5.3 hasta que el error aproximado sea 
menor que el criterio de terminación de e, = 0.5%. Use la ecuación (5.2) para calcular los errores. 


Solución Los resultados de las primeras dos iteraciones en el ejemplo 5.3 fueron 14 y 15. Al sus- 
tituir estos valores en la ecuación (5.2) se obtiene 
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a 


Juas 


A 100% = 6.667 % 
15 


Recuerde que el error relativo porcentual para la raíz estimada de 15 fue 1.3%. Por lo tanto, e, es 
mayor a e. Este comportamiento se manifiesta en las otras iteraciones: 


Iteración X; Xu Xx, €. (%) E, (%) 
1 12 16 14 5.413 
Z 14 16 lis 6.667 1.344 
3 14 15 14.5 3.448 2.035 
4 14.5 15 14.75 1.695 0.345 
5 14.75 15 14.875 0.840 0.499 
6 14.75 14.875 14.8125 0.422 0.077 


Así, después de seis iteraciones e, finalmente está por debajo de e, = 0.5%, y el cálculo puede 
terminar. 

Estos resultados se resumen en la figura 5.7. La naturaleza “desigual” del error verdadero se 
debe a que, en el método de la bisección, la raíz exacta se encuentra en cualquier lugar dentro del 
intervalo cerrado. Los errores verdadero y aproximado quedan distantes cuando el intervalo está 
centrado sobre la raíz verdadera. Ellos están cercanos cuando la raíz verdadera se halla en cualquier 
extremo del intervalo. 


Aunque el error aproximado no proporciona una estimación exacta del error verdadero, la figu- 
ra 5.7 sugiere que e, toma la tendencia general descendente de e,. Además, la gráfica muestra una 
característica muy interesante: que e, siempre es mayor que e,. Por lo tanto, cuando e,, es menor que 
e, los cálculos se pueden terminar, con la confianza de saber que la raíz es al menos tan exacta como 
el nivel aceptable predeterminado. 
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Errores en el método de bisección. Los errores 
verdadero y aproximado se grafican contra el 
número de iteraciones. 


Aunque no es conveniente aventurar conclusiones generales a partir de un 
solo ejemplo, es posible demostrar que e, siempre será mayor que e, en el mé- 
todo de bisección. Esto se debe a que cada vez que se encuentra una aproxima- 
ción a la raíz cuando se usan bisecciones como x, = (x,+ x,)/2, se sabe que la 
raíz verdadera se halla en algún lugar dentro del intervalo de (x, —x,)/2 = Ax/2. 
Por lo tanto, la raíz debe situarse dentro de +Ax/2 de la aproximación (figura 
5.8). Así, cuando se terminó el ejemplo 5.3 podemos afirmar definitivamente 
que 


x,=14.5+0.5 


Debido a que Ax/2=x,2— y, 2enor (figura 5.9), la ecuación (5.2) propor- 
ciona un límite superior exacto del error verdadero. Para que se rebase este 
límite, la raíz verdadera tendría que estar fuera del intervalo que la contiene, 
lo cual, por definición, jamás ocurrirá en el método de bisección. El ejemplo 
5.6 muestra otras técnicas de localización de raíces que no siempre resultan tan 
eficientes. Aunque el método de bisección por lo general es más lento que otros 
métodos, la claridad del análisis de error ciertamente es un aspecto positivo 
que puede volverlo atractivo para ciertas aplicaciones en ingeniería. 

Antes de utilizar el programa de computadora para la bisección, debemos 
observar que las siguientes relaciones (figura 5.9) 

e did Ea q = Xy . Xx; 

y 


nuevo __ 7) +X, 


ú 2 
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pueden sustituirse en la ecuación (5.2) para desarrollar 


dra á A a Xx] X,. Xi 
una formulación alternativa en la aproximación del error > | e ¡ 
relativo porcentual e | 
XxX —X Xx] *, Xu 
e, = | 100% (53)  b | X 
Xx, FX, 
Esta ecuación resulta idéntica a la ecuación (5.2) para X; Xx, Xy 
la bisección. Además, permite calcular el error basán- c) 0 o | 
dose en nuestros valores iniciales; es decir, en la pri- 
mera iteración. Por ejemplo, en la primera iteración del x12 x12 
ejemplo 5.2, el error aproximado se calcula como 5 58 ES 
16-12 Raíz verdadera 
E, = DS 100% = 14.29% 
16+12 


Figura 5.8 

Tres formas en que un intervalo puede encerrar a la raíz. En a) el valor 
verdadero está en el centro del intervalo, mientras que en b) y c) el 
absoluto se calcula a priori, esto es, antes de empezar las valor verdadero está cerca de los extremos. Observe que la diferencia 
iteraciones, donde se observa que antes de empezar esta entre el valor verdadero y el punto medio del intervalo jamás sobrepa- 
técnica, el error absoluto es sa la longitud media del intervalo, o Ax/2. 


Otro beneficio del método de bisección es que el 
número de iteraciones requerido para obtener un error 


0_,0_,0_A,0 
E, =X, xXx, =Ax 


donde los superíndices definen la iteración. Por lo tan- 


to, antes de empezar el método se tiene la “iteración x nuevo _ yy anterior 
cero”. Después de la primera iteración el error será RRE 
l l 
1 Ax” l 1 
E = me a | $ l | 
Y 
a 2 Iteración anterior [ | 
as : 
l 


Debido a que en cada iteración se reduce el error a la 
. 4 . I 
mitad, la fórmula general que relaciona el error y el E 
A : ; “e l 
número de iteraciones, n, es Iteración actual ¡ 0 
I 
I 
I 


nuevo 


I 
n Ax” 
a (5.4) A 
Ax/2 
S1 E, es el error deseado, en esta ecuación se despeja 
Figura 5.9 
a log(Ax"/E, ¿) _ Ax? (5.5) Representación gráfica de por qué la estimación del error para el mé- 
di log 2 — 2982 Es ; todo de bisección (Ax/2) es equivalente a la raíz estimada en la itera- 
ds ción actual (x,"""") menos la raíz aproximada en la iteración anterior 
(a uenon, q 


Probemos la fórmula. En el ejemplo 5.4, el inter- 
valo inicial fue Ax, = 16 — 12 = 4. Después de seis ite- 
raciones, el error absoluto era 


E 


a 


E para O be 


Si se sustituyen esos valores en la ecuación (5.5) resulta 


ca log(4/0.0625) — 
log 2 


6 


Entonces, si se sabe de antemano que un error menor a 0.0625 es aceptable, la fórmula indica que 
con seis iteraciones se consigue el resultado deseado. 

Aunque se ha puesto énfasis en el uso del error relativo por obvias razones, habrá casos (usual- 
mente a través del conocimiento del contexto del problema) donde se podrá especificar el error ab- 
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FUNCTION Bisectíxl, 
iter= 0 
DO 
xrold = xr 


xr = (x1 + xu)/2 


¡ter = ¡ter + 1 
IF xr 0 THEN 
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soluto. En esos casos, la bisección junto con la ecuación (5.5) ofrece un útil algoritmo de localización 
de raíces. Se explorarán tales aplicaciones con los problemas al final del capítulo. 


5.2.2 Algoritmo de bisección 


El algoritmo en la figura 5.5 se extiende para incluir verificación del error (figura 5.10). El algoritmo 
emplea funciones definidas por el usuario para volver más eficientes la localización de las raíces y 
la evaluación de las funciones. Además, se le pone un límite superior al número de iteraciones. Por 
último, se incluye la verificación de errores para evitar la división entre cero durante la evaluación 
del error. Éste podría ser el caso cuando el intervalo está centrado en cero. En dicha situación la 
ecuación (5.2) tiende a infinito. Si esto ocurre, el programa saltará la evaluación de error en esa 
iteración. 

El algoritmo en la figura 5.10 no es amigable al usuario; más bien está diseñado estrictamente 
para dar la respuesta. En el problema 5.14 al final del capítulo, se tendrá una tarea para volverlo 
fácil de usar y de entender. 


5.2.3 Minimización de las evaluaciones de una función 


El algoritmo de bisección de la figura 5.10 es adecuado si se quiere realizar la evaluación de una sola 
raíz de una función que es fácil de evaluar. Sin embargo, hay muchos casos en ingeniería que no son 
así. Por ejemplo, suponga que se quiere desarrollar un programa computacional que localice varias 
raíces. En tales casos, se tendría que llamar al algoritmo de 
la figura 5.10 miles o aun millones de veces en el transcur- 
xu, es, imax, xr, fter, ea) so de una sola ejecución. 

Además, en un sentido más general, la función de una 
variable es tan sólo una entidad que regresa un solo valor 
para un solo valor que se le da. Visto de esta manera, las 
funciones no son simples fórmulas como las ecuaciones de 
una sola línea de código resueltas en los ejemplos anteriores 


ea = ABS((xr - xrold) / xr) * 100 de este capítulo. Por ejemplo, una función puede consistir de 
END IF muchas líneas de código y su evaluación llega a tomar un 
test = f(x1) * f(xr) tiempo importante de ejecución. En algunos casos, esta 
IF test < 0 THEN función incluso representaría un programa de computado- 
XU == XP ra independiente. 
ELSE IF test > 0 THEN Debido a ambos factores es imperativo que los algorit- 
an E mos numéricos minimicen las evaluaciones de una función. 
a Zo A la luz de estas consideraciones, el algoritmo de la figura 
END TF 5.10 es deficiente. En particular, observe que al hacer dos 
ET evaluaciones de una función por iteración, vuelve a calcu- 
END DO lar una de las funciones que se determinó en la iteración 
Bisect = xr anterior. 

END Bisect La figura 5.11 proporciona un algoritmo modificado 
que no tiene esta deficiencia. Se han resaltado las líneas que 
difieren de la figura 5.10. En este caso, únicamente se cal- 

Figura 5.10 cula el valor de la nueva función para aproximar la raíz. 

Pseudocódigo para la función que implementa el método de bi- Los valores calculados previamente son guardados y sim- 

sección. plemente reasignados conforme el intervalo se reduce. Así, 


las 2n evaluaciones de la función se reducen an + l. 


5.3 MÉTODO DE LA FALSA POSICIÓN 


Aun cuando la bisección es una técnica perfectamente válida para determinar raíces, su método de 
aproximación por “fuerza bruta” es relativamente ineficiente. La falsa posición es una alternativa 
basada en una visualización gráfica. 


5.3 Método de la falsa posición 


Un inconveniente del método de bisección es que al di-_ FUNCTION Bisect(x7, xu, es, imax, Xr, ¡iter, 
vidir el intervalo de x, a x, en intervalos iguales, no se toman Tter= 0 
en consideración las magnitudes de f(x,) y f(x,). Por ejemplo, => FET, 
si f(x) está mucho más cercana a cero que f(x,), es lógico que DO 
la raíz se encuentre más cerca de x, que de x, (figura 5.12). xrold = xr 


xr= (xl + xu) / 2 
fr= f(xr) 

¡ter = ¡ter + 1 

IF xr 0 THEN 


Un método alternativo que aprovecha esta visualización 
gráfica consiste en unir f(x) y f(x, ) con una línea recta. La 
intersección de esta línea con el eje de las x representa una 


mejor aproximación de la raíz. El hecho de que se reemplace e ABC = radar A 100 
la curva por una línea recta da una “falsa posición” de la raíz; END IF 
de aquí el nombre de método de la falsa posición, o en latín, test= A * fr 
regula falsi. También se le conoce como método de interpo- IF test < 0 THEN 
lacion lineal. xU = xr 
ELSE IF test > 0 THEN 
xl = xr 
M= PP 
ELSE 
ea = 0 
END IF 
Figura 5.11 IF ea < es OR ¡ter > imax EXIT 
Pseudocódigo para el subprograma de bisección que minimiza END DO 
las evaluaciones de la función. Bisect = xr 
END Bisect 


Usando triángulos semejantes (figura 5.12), la intersección de la línea recta con el eje de las x 
se estima mediante 


Xx Xx 
JD): _ Fi) pe 
*, Ss Xx; *, S X, 
en la cual se despeja x, (véase cuadro 5.1 para los detalles) 
A (5.7) 


2 YA) 


Ésta es la fórmula de la falsa posición. El valor de x, calculado 
con la ecuación (5.7), reemplazará, después, a cualquiera de los 
dos valores iniciales, x, o x,, y da un valor de la función con el 
mismo signo de f(x,). De esta manera, los valores x, y x, siempre 
encierran la verdadera raíz. El proceso se repite hasta que la 
aproximación a la raíz sea adecuada. El algoritmo es idéntico al 
de la bisección (figura 5.5), excepto en que la ecuación (5.7) se usa 
en el paso 2. Además, se usa el mismo criterio de terminación 
[ecuación (5.2)] para concluir los cálculos. 


FO + 


FA.) 
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ea) 


Figura 5.12 

Representación gráfica del método de la falsa posición. Con los 
triángulos semejantes sombreados se obtiene la fórmula para el 
método. 


fp 
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Cuadro 5.1 Desarrollo del método de la falsa posición 


Multiplicando en cruz la ecuación (5.6) obtenemos sumando y restando x, en el lado derecho: 


FO), —x,) =A0J%,—x) x= HD A 
GRITE) II) 


Agrupando términos y reordenando: 
Agrupando términos se obtiene 


Xx, A) $60] = Xx, ¡) => Xx fx.) 


dea Xfx, ) Xx, £(x,,) 
Dividiendo entre Ax) — Ax,): o JAY) FA) F,) 
a or (5.1.1) 2 
xx), , 
ea LOA) 


Ésta es una de las formas del método de la falsa posición. Observe o FA) AA) 
que permite el cálculo de la raíz x, como una función de los valores 
iniciales inferior x, y superior x,. Ésta puede ponerse en una forma — la cual es la misma ecuación (5.7). Se utiliza esta forma porque im- 
alternativa al separar los términos: plica una evaluación de la función y una multiplicación menos que 
ACES JS la ecuación (B5.1.1). Además ésta es directamente comparable con 
Xx, = A o el método de la secante, el cual se estudia en el capítulo 6. 
FA) AR) FA) 


EJEMPLO 5.5 Falsa posición 


Planteamiento del problema Con el método de la falsa posición determine la raíz de la misma 
ecuación analizada en el ejemplo 5.1 [ecuación (E5.1.1)]. 


Solución Como en el ejemplo 5.3 se empieza el cálculo con los valores iniciales x,= 12 y x, = 16. 


Primera iteración: 


x= 12 Fc) = 6.1139 
x,=16 Fx) =-2.2303 
PS 


: 6.1139 — (-2.2303) 
que tiene un error relativo verdadero de 0.88 por ciento. 


Segunda iteración: 

Kay foc) =-1.5376 
Por lo tanto, la raíz se encuentra en el primer subintervalo, y x, se vuelve ahora el límite superior 
para la siguiente iteración, x, = 14.9309: 

x =12 FG) = 6.1139 

XxX, = 14.9309  f(x,)=-0.2515 


x,=14.9309 -0.2515(12— 14.9309) = 148151 
6.1139— (0.2515) 


el cual tiene error relativo verdadero y aproximado de 0.09 y 0.79 por ciento. Es posible realizar itera- 
ciones adicionales para hacer una mejor aproximación de las raíces. 
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Se obtiene una idea más completa de la eficiencia de los métodos de 
bisección y de falsa posición al observar la figura 5.13, donde se muestra el 
error relativo porcentual verdadero de los ejemplos 5.4 y 5.5. Observe cómo 
el error decrece mucho más rápidamente en el método de la falsa posición 
que en el de la bisección, debido a un esquema más eficiente en el método de 
la falsa posición para la localización de raíces. 

Recuerde que en el método de bisección el intervalo entre x, y x, se va 
haciendo más pequeño durante los cálculos. Por lo tanto, el intervalo, como 
se definió por Ax/2 = |x, — x//2 para la primera iteración, proporciona una 
medida del error en este método. Éste no es el caso con el método de la falsa 
posición, ya que uno de los valores iniciales puede permanecer fijo durante 
los cálculos, mientras que el otro converge hacia la raíz. Como en el caso del 
ejemplo 5.5, el extremo inferior x, permanece en 12, mientras que x, conver- 
ge a la raíz. En tales casos, el intervalo no se acorta, sino que se aproxima a 
un valor constante. 

El ejemplo 5.5 sugiere que la ecuación (5.2) representa un criterio de 
error muy conservador. De hecho, la ecuación (5.2) constituye una aproxima- 
ción de la discrepancia en la iteración previa. Esto se debe a que para un caso, 
tal como el del ejemplo 5.5, donde el método converge rápidamente (por 
ejemplo, el error se va reduciendo casi un 100% de magnitud por cada itera- 
ción), la raíz para la iteración actual x,“” es una mejor aproximación al 
valor real de la raíz, que el resultado de la iteración previa x,““"*_ Así, el 
numerador de la ecuación (5.2) representa la discrepancia de la iteración 
previa. En consecuencia, se nos asegura que al satisfacer la ecuación (5.2), la 
raíz se conocerá con mayor exactitud que la tolerancia preestablecida. Sin 
embargo, como se ve en la siguiente sección, existen casos donde el método 
de la falsa posición converge lentamente. En tales casos la ecuación (5.2) no 
es confiable y se debe desarrollar un criterio diferente de terminación. 


5.3.1 Desventajas del método de la falsa posición 
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Comparación de los errores relativos de los mé- 
todos de bisección y de la falsa posición. 


Aunque el método de la falsa posición parecería ser siempre la mejor opción entre los métodos ce- 
rrados, hay casos donde funciona de manera deficiente. En efecto, como en el ejemplo siguiente, hay 


ciertos casos donde el método de bisección ofrece mejores resultados. 


EJEMPLO 5.6 Un caso en el que la bisección es preferible a la falsa posición 


Planteamiento del problema Con los métodos de bisección y de falsa posición localice la raíz de 


f0)=x'"-1 
entre x=0 y 1.3. 


Solución Usando bisección, los resultados se resumen como sigue 


. a 


Iteración Xx Xu X, e. (%) e:(%) 
1 0 1.3 0.65 100.0 35 
2 0.65 1.3 0.975 33.3 25 
3 0.975 1.3 1.1375 14.3 13.8 
4 0.975 1.1375 1.05625 7.7 5.6 
5 0.975 1.05625 1.015625 4.0 1.6 


De esta manera, después de cinco iteraciones, el error verdadero se reduce a menos del 2%. Con la 


falsa posición se obtienen resultados muy diferentes: 
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. === === 


Iteración Xx Xu X, e.(%) e:(%) 


1 0 1.3 0.09430 90.6 
2 0.09430 1.3 0.18176 48.1 81.8 
3 0.18176 13 0.26287 30.9 73.7 
4 0.26287 1.3 0.33811 22:3 66.2 
5 0.33811 13 


0.40788 17.1 59.2 


== 


Después de cinco iteraciones, el error verdadero sólo se ha reducido al 59%. Además, observe 
que e, < €, Entonces, el error aproximado es engañoso. Se obtiene mayor claridad sobre estos resul- 
tados examinando una gráfica de la función. En la figura 5.14, la curva viola la premisa sobre la cual 
se basa la falsa posición; es decir, si f(x,) se encuentra mucho más cerca de cero que f(x,), la raíz se 
encuentra más cerca de x, que de x, (recuerde la figura 5.12). Sin embargo, debido a la forma de esta 
función ocurre lo contrario. 


El ejemplo anterior ilustra que, por lo común, no es posible realizar generalizaciones con los 
métodos de obtención de raíces. Aunque un método como el de la falsa posición casi siempre es 
superior al de bisección, hay algunos casos que violan esta conclusión general. Por lo tanto, además 
de usar la ecuación (5.2), los resultados se deben verificar sustituyendo la raíz aproximada en la 
ecuación original y determinar si el resultado se acerca a cero. 
Esta prueba se debe incorporar en todos los programas que 
localizan raíces. 

El ejemplo ilustra también una importante desventaja del 
método de la falsa posición: su unilateralidad. Es decir, con- 
forme se avanza en las iteraciones, uno de los puntos limitan- 
tes del intervalo tiende a permanecer fijo. Esto puede llevar a 
una mala convergencia, especialmente en funciones con una 
curvatura importante. La sección siguiente ofrece una solución. 


5.3.2 Falsa posición modificada 


Una forma de disminuir la naturaleza unilateral de la falsa 
posición consiste en obtener un algoritmo que detecte cuando 
se “estanca” uno de los límites del intervalo. Si ocurre esto, se 
divide a la mitad el valor de la función en el punto de “estan- 
camiento”. A este método se le llama método de la falsa posi- 
ción modificado. 

El algoritmo dado en la figura 5.15 lleva a cabo dicha es- 
trategia. Observe cómo se han usado contadores para determi- 
nar si uno de los límites del intervalo permanece fijo 
“estancado” durante dos iteraciones. Si ocurre así, el valor de 
la función en este valor de “estancamiento” se divide a la mitad. 

E La efectividad de este algoritmo se demuestra aplicándolo 
x al ejemplo 5.6. Si se utiliza un criterio de terminación de 0.01% 
el método de bisección y el método estándar de falsa posición 
convergerán, respectivamente, después de 14 y 39 iteraciones. 
En cambio el método de la falsa posición modificado conver- 


Figura 5.14 gerá después de 12 iteraciones. De manera que para este ejemplo 
Gráfica de la función f(x) = x' — 1, ilustrando la lentitud de el método de la falsa posición modificado es más eficiente que 
convergencia del método de la falsa posición. el de bisección y muchísimo mejor que el método de la falsa 


posición no modificado. 
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5.4 BÚSQUEDAS POR INCREMENTOS Y DETERMINACIÓN 
DE VALORES INICIALES 


Además de verificar una respuesta individual, se debe 
determinar si se han localizado todas las raíces posibles. FUNCTION ModFalsePos(x1, xu, es, imax, xr, ¡ter, ea) 


Como se mencionó anteriormente, por lo general una iter=0 
gráfica de la función ayudará a realizar dicha tarea. fl = F(x1) 
Otra opción es incorporar una búsqueda incremental fu = f(xu) 

al inicio del programa. Esto consiste en empezar en un DO 

extremo del intervalo de interés y realizar evaluaciones xrold = xr 


xr= o xu-= fu * (xl - xu) / (A - fu) 
fr= f(xr) 

¡ter = ¡ter + 1 

IF xr <> 0 THEN 


de la función con pequeños incrementos a lo largo del 
intervalo. Si la función cambia de signo, se supone que 
la raíz está dentro del incremento. Los valores de x, al 


principio y al final del incremento, pueden servir como do == ASti ST La 
valores iniciales para una de las técnicas descritas en END IF 
este capítulo. test= A * fr 
Un problema potencial en los métodos de búsque- IF test < 0 THEN 
da por incremento es el de escoger la longitud del in- xXu = xr 
cremento. Si la longitud es muy pequeña, la búsqueda fu = f(xu) 
llega a consumir demasiado tiempo. Por otro lado, si la tu =0 
longitud es demasiado grande, existe la posibilidad de E 


If 1122 THEN AN=RN/ 2 


que raíces muy cercanas entre sí pasen inadvertidas 
ELSE IF test > 0 THEN 


(figura 5.16). El problema se complica con la posible 


existencia de raíces múltiples. Un remedio parcial para a 3 el e 
estos casos consiste en calcular la primera derivada de O 
la función f'(x) al inicio y al final de cada intervalo. io 
Cuando la derivada cambia de signo, puede existir un IF du > 2 THEN fu = fu / 2 
máximo o un mínimo en ese intervalo, lo que sugiere ELSE 
una búsqueda más minuciosa para detectar la posibili- ea=0 
dad de una raíz. END IF 
Aunque estas modificaciones o el empleo de un IF ea < es OR ¡ter 2 ¡max THEN EXIT 
incremento muy fino ayudan a resolver el problema, se END DO 


ModFalsePos = xr 


debe aclarar que métodos como el de la búsqueda in- 
END ModFalsePos 


cremental no siempre resultan sencillos. Será prudente 
complementar dichas técnicas automáticas con cualquier 
otra información que dé idea de la localización de las 
raíces. Esta información se puede encontrar graficando Figura 5.15 

la función y entendiendo el problema físico de donde  Pseudocódigo para el método de la falsa posición modificado. 
proviene la ecuación. 


FO? 


Figura 5.16 

Casos donde las raíces pueden pasar inadvertidas de- 
bido a que la longitud del incremento en el método de 
búsqueda incremental es demasiado grande. Observe 
que la última raíz a la derecha es múltiple y podría dejar 
de considerarse independientemente de la longitud del 
incremento. 
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PROBLEMAS 


5.1 Determine las raíces reales de f(x) =-0.5x? + 2.5x + 4.5: 

a) Gráficamente. 

b) Empleando la fórmula cuadrática. 

c) Usando el método de bisección con tres iteraciones para deter- 
minar la raíz más grande. Emplee como valores iniciales x, = 
5 y x, = 10. Calcule el error estimado e, y el error verdadero e, 
para cada iteración. 

5.2 Determine las raíces reales de f(x) = 517 — 51? +6x-—2: 

a) Gráficamente. 

b) Utilizando el método de bisección para localizar la raíz. Use 
los valores iniciales x, = 0 y x, = 1 iterando hasta que el error 
estimado e, se encuentre debajo de e, = 10%. 

5.3 Determine las raíces reales de f(x) =-25 + 82x — 9017 + 441 — 8x* 
+0.7x%: 

a) Gráficamente. 

b) Usando el método de bisección para localizar la raíz más grande 
con e, = 10%. Utilice como valores iniciales x,=0.5 y x, = 1.0. 

c) Realice el mismo cálculo que en b), pero con el método de la 
falsa posición y e, = 0.2%. 

5.4 a) Determine gráficamente las raíces de f(x) =-12 — 21x + 18x? 
— 2.75x?, Además, determine la primera raíz de la función con b) 
bisección y c) posición falsa. Para b) y c), utilice valores iniciales 
para x,=-—1 y x, =0, y un criterio de detención de 1%. 

5.5 Localice la primera raíz no trivial de sen x=", donde x está en 
radianes. Use una técnica gráfica y bisección con un intervalo inicial 
de 0.5 a 1. Haga el cálculo hasta que e,, sea menor que e, =2%. Rea- 
lice también una prueba de error sustituyendo la respuesta final en la 
ecuación original. 

5.6 Determine la raíz real de ln (1?) =0.7: 

a) Gráficamente. 

b) Empleando tres iteraciones en el método de bisección con los 
valores iniciales x, =0.5 y x, =2. 

c) Usando tres iteraciones del método de la falsa posición, con los 
mismos valores iniciales de b). 

5.7 Determine la raíz real de f(x) = (0.8 — 0.3x)/x: 

a) Analíticamente. 

b) Gráficamente. 

c) Empleando tres iteraciones en el método de la falsa posición, 
con valores iniciales de 1 a 3, calcule el error aproximado e, y 
el error verdadero e,en cada iteración. ¿Hay algún problema con 
el resultado? 

5.8 Calcule la raíz cuadrada positiva de 18 usando el método de la 
falsa posición con e, = 0.5%. Emplee como valores iniciales 
x=4yx,=5. 

5.9 Encuentre la raíz positiva más pequeña de la función (x está en 
radianes) El cos Vx| = 5 usando el método de la falsa posición. Para 
localizar el intervalo en donde se encuentra la raíz, grafique primero 
esta función para valores de x entre O y 5. Realice el cálculo hasta 
que e, sea menor que e,= 1%. Compruebe su respuesta final sustitu- 
yéndola en la función original. 

5.10 Encuentre la raíz positiva de Ax) =x*—8x-35x?+450x—1001, 
utilizando el método de la falsa posición. Tome como valores iniciales 
ax,=4.5 y x, = 6, y ejecute cinco iteraciones. Calcule los errores 
tanto aproximado como verdadero, con base en el hecho de que la raíz 
es 5.60979. Emplee una gráfica para explicar sus resultados y hacer 
el cálculo dentro de un e,= 1.0%. 

5.11 Determine la raíz real de x** = 80: 


a) En forma analítica. 

b) Con el método de la falsa posición dentro de e, = 2.5%. Haga 
elecciones iniciales de 2.0 a 5.0. 

5.12 Dada 


Jo) =-2x* — 1.514 + 10x +2 


Use el método de la bisección para determinar el máximo de esta 
función. Haga elecciones iniciales de x,=0 y x, = 1, y realice ite- 
raciones hasta que el error relativo aproximado sea menor que 5%. 
5.13 La velocidad vu de un paracaidista que cae está dada por 


v= E 0% pa 


C 


donde g = 9.81 m/s”. Para un paracaidista con coeficiente de resis- 
tencia de c = 15 kg/s, calcule la masa m de modo que la velocidad 
sea v=36 m/s en 1= 10 s. Utilice el método de la falsa posición para 
determinar m a un nivel de e, =0.1%. 

5.14 Use bisección para determinar el coeficiente de resistencia ne- 
cesario para que un paracaidista de 82 kg tenga una velocidad de 36 
m/s después de 4 s de caída libre. Nota: La aceleración de la gravedad 
es 9.81 m/s?. Comience con valores iniciales de x,=3 y x, =5. Itere 
hasta que el error relativo aproximado caiga por debajo de 2%. Rea- 
lice también una detección de errores sustituyendo su respuesta final 
en la ecuación original. 

5.15 Como se ilustra en la figura P5.15, la velocidad del agua, v 
(m/s), en la descarga de un tanque cilíndrico a través de un tubo 
largo se puede calcular como 


V22H ) 

2L ; 
donde g = 9.81 m/s?, H= carga hidrostática inicial (m), L = longitud 
de tubo (m) y £ = tiempo transcurrido (s). Determine la carga hidros- 
tática necesaria para obtener v = 5 m/s en 2.5 s para un tubo de 4 m 
de longitud a) gráficamente, b) por bisección y c) con posición falsa. 


Utilice los valores iniciales de x, = 0 y x,= 2 m, con un criterio de 
detención de e,= 1%. Revise sus resultados. 


v= V2gH cn 


-“— Y —> 


Figura P5.15 


5.16 Por un canal trapezoidal fluye agua a una tasa de Q =20 m/'/s. 
La profundidad crítica y para dicho canal satisface la ecuación 


aL 
8A; 


donde g = 9.81m/s?, A. = área de la sección transversal (m?), y B = 
ancho del canal en la superficie (m). Para este caso, el ancho y el área 
de la sección transversal se relacionan con la profundidad y por 
medio de 

2 


A,=3y+2 


B=3+y y 2 


Resuelva para la profundidad crítica con el uso de los métodos a) 
gráfico, b) bisección y c) falsa posición. En los incisos b) y c), haga 
elecciones iniciales de x,=0.5 y x, =2.5, y ejecute iteraciones hasta 
que el error aproximado caiga por debajo del 1% o el número de in- 
teraciones supere a 10. Analice sus resultados. 

5.17 Suponga el lector que está diseñando un tanque esférico (véase 
la figura P5.17) para almacenar agua para un poblado pequeño en un 
país en desarrollo. El volumen de líquido que puede contener se 
calcula con 


V=xh? pen Bl 


donde V= volumen [m*], h = profundidad del agua en el tanque [m] 
y R =radio del tanque [m]. 

Si R=3 m, ¿a qué profundidad debe llenarse el tanque de modo 
que contenga 30 m*? Haga tres iteraciones con el método de la falsa 
posición a fin de obtener la respuesta. Determine el error relativo 
aproximado después de cada iteración. Utilice valores iniciales de O 
y R. 


h 


Figura P5.17 


5.18 La concentración de saturación de oxígeno disuelto en agua 
dulce se calcula con la ecuación (APHA, 1992) 


6.642308 x 10” 
ed 


1.575701x10* 


In 0, =-139.34411+ 


a 


1.243800x10'" 8.621949x10" 
+ T? T* 


a a 


donde o,,= concentración de saturación de oxígeno disuelto en agua 
dulce a 1 atm (mg/L) y T,, = temperatura absoluta (K). Recuerde el 
lector que 7, = T + 273.15, donde T = temperatura (*C). De acuer- 
do con esta ecuación, la saturación disminuye con el incremento de 
la temperatura. Para aguas naturales comunes en climas templados, la 
ecuación se usa para determinar que la concentración de oxígeno 
varía de 14.621 mg/L a 0”C a 6.413 mg/L a 40*C. Dado un valor de 
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concentración de oxígeno, puede emplearse esta fórmula y el método 
de bisección para resolver para la termperatura en *C. 

a) Silos valores iniciales son de O y 40%C, con el método de la 
bisección, ¿cuántas iteraciones se requerirían para determinar 
la temperatura con un error absoluto de 0.05%C? 

b) Desarrolle y pruebe un programa para el método de bisección a 
fin de determinar 7 como función de una concentración dada de 
oxígeno, con un error absoluto preespecificado como en el inciso 
a). Dadas elecciones iniciales de O y 40%C, pruebe su programa 
para un error absoluto de 0.05”C para los casos siguientes: 0,,= 
8, 10 y 12 mg/L. Compruebe sus resultados. 

5.19 De acuerdo con el principio de Arquímedes, la fuerza de flota- 
ción es igual al peso de fluido desplazado por la porción sumergida 
de un objeto. Para la esfera ilustrada en la figura PS.19, use la bisec- 
ción para determinar la altura h de la porción que queda encima del 
agua. Utilice los siguientes valores para su cálculo: r= 1 m, p, = 
densidad de la esfera = 200 kg/m! y p,, = densidad del agua = 1000 
kg/m'. Observe que el volumen de la porción de la esfera por encima 
del agua se puede calcular mediante 


2 


yá 
ES 
. 
> 
Figura P5.19 


5.20 Realice el mismo cálculo que en el problema 5.19, pero para el 
frústum de un cono, como se ilustra en la figura P5.20. Use los si- 
guientes valores para su cálculo: r,=0.5m,r,=1m,h4=1m, p,= 
densidad del frústum = 200 kg/m*, y p,, = densidad del agua = 1 000 
kg/m'. Observe que el volumen del frústum está dado por 


Th, > 
V= 30 + 5 + 11) 


E > 


Figura P5.20 
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5.21 Integre el algoritmo que se bosquejó en la figura 5.10, en forma 
de subprograma completo para el método de bisección amigable para 
el usuario. Entre otras cosas: 

a) Construya enunciados de documentación en el subprograma a 
fin de identificar lo que se pretende que realice cada sección. 

b) Etiquete la entrada y la salida. 

c) Agregue una comprobación de la respuesta, en la que se susti- 
tuya la estimación de la raíz en la función original para verificar 
si el resultado final se acerca a cero. 

d) Pruebe el subprograma por medio de repetir los cálculos de los 
ejemplos 5.3 y 5.4. 

5.22 Desarrolle un subprograma para el método de bisección que 
minimice las evaluaciones de la función, con base en el pseudocódi- 
go que se presenta en la figura 5.11. Determine el número de evalua- 
ciones de la función (n) para el total de iteraciones. Pruebe el 
programa con la repetición del ejemplo 5.6. 

5.23 Desarrolle un programa amigable para el usuario para el 
método de la falsa posición. La estructura del programa debe ser 
similar al algoritmo de la bisección que se bosquejó en la figura 
5.10. Pruebe el programa con la repetición del ejemplo 5.5. 


5.24 Desarrolle un subprograma para el método de la falsa posición 
que minimice las evaluaciones de la función en forma similar a la 
figura 5.11. Determine el número de evaluaciones de la función (n) 
para el total de iteraciones. Pruebe el programa por medio de la du- 
plicación del ejemplo 5.6. 

5.25 Desarrolle un subprograma amigable para el usuario para el 
método de la falsa posición modificado, con base en la figura 5.15. 
Pruebe el programa con la determinación de la raíz de la función del 
ejemplo 5.6. Ejecute corridas hasta que el error relativo porcentual 
verdadero esté por debajo de 0.01%. Elabore una gráfica en un 
entorno semilogarítmico de los errores relativo, porcentual, aproxi- 
mado y verdadero, versus el número de iteraciones. Interprete los 
resultados. 

5.26 Desarrolle una función para bisección de modo similar a la fi- 
gura 5.10. Sin embargo, en vez de usar iteraciones máximas y la 
ecuación (5.2), utilice la ecuación (5.5) como criterio de detención. 
Asegúrese de redondear el resultado de la ecuación (5.5) al máximo 
entero siguiente. Pruebe su función resolviendo el ejemplo 5.3 usan- 
do E, ¿= 0.0001. 


Métodos abiertos 


En los métodos cerrados del capítulo anterior la raíz se encuentra dentro de un intervalo predeter- 
minado por un límite inferior y otro superior. La aplicación repetida de estos métodos siempre ge- 
nera aproximaciones cada vez más cercanas al valor verdadero de la raíz. Se dice que tales métodos 
son convergentes porque se acercan progresivamente a la raíz a medida que se avanza en el cálculo 
(figura 6.1a). 

En contraste, los métodos abiertos descritos en este capítulo se basan en fórmulas que requieren 
únicamente de un solo valor de inicio x o que empiecen con un par de ellos, pero que no necesaria- 
mente encierran la raíz. Éstos, algunas veces, divergen o se alejan de la raíz verdadera a medida que 
se avanza en el cálculo (figura 6.1b). Sin embargo, cuando los métodos abiertos convergen (figura 
6.1c), en general lo hacen mucho más rápido que los métodos cerrados. Empecemos el análisis de 
los métodos abiertos con una versión simple que es útil para ilustrar su forma general y también para 
demostrar el concepto de convergencia. 


6.1 ITERACIÓN SIMPLE DE PUNTO FIJO 


Como se dijo antes, los métodos abiertos emplean una fórmula para predecir la raíz. Esta fórmula 
puede desarrollarse como una iteración simple de punto fijo (también llamada iteración de un pun- 
to o sustitución sucesiva o método de punto fijo), al arreglar la ecuación f(x) = O de tal modo que x 
esté del lado izquierdo de la ecuación: 

x= g(x) (6.1) 
Esta transformación se realiza mediante operaciones algebraicas o simplemente sumando x a cada 
lado de la ecuación original. Por ejemplo, 

2-2x+3=0 
se arregla para obtener 


x2+3 
2 


X= 


Fx) FIDA 


mientras que sen x = O puede transformarse en la forma de la 
ecuación (6.1) sumando x a ambos lados para obtener 


X=SEenx+x 


La utilidad de la ecuación (6.1) es que proporciona una fór- 
mula para predecir un nuevo valor de x en función del valor an- 


terior de x. De esta manera, dado un valor inicial para la raíz x,, 


Figura 6.1 

Representación gráfica de las diferencias fundamentales entre los 
métodos a) cerrados, b) y c) los métodos abiertos para el cálculo 
de raíces. En a) se ilustra el método de bisección, donde la raíz está 
contenida dentro del intervalo dado por x, y x,. En contraste, en 
los métodos abiertos, ilustrados en b) y c), se utiliza una fórmula 


para dirigirse de x; a x,,,, con un esquema iterativo. Así, el método 
puede b) diverger o c) converger rápidamente, dependiendo de los 
valores iniciales. 
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la ecuación (6.1) se utiliza para obtener una nueva aproximación x;,¡, expresada por la fórmula ite- 
rativa 


Xi = 8(X;) (6.2) 


Como en otras fórmulas iterativas de este libro, el error aproximado de esta ecuación se calcula 
usando el error normalizado estimador [ecuación (3.5)]: 


ia A 100% 


Xi 


EJEMPLO 6.1  Iteración simple de punto fijo 


Planteamiento del problema Use una iteración simple de punto fijo para localizar la raíz de 


0) =e*-x. 


Solución Lafunción se puede separar directamente y expresarse en la forma de la ecuación (6.2) como 
X= e % 


Empezando con un valor inicial x, = 0, se aplica esta ecuación iterativa para calcular 


X; Ea (%) er(%) 


i 

0 0 100.0 

1 1.000000 100.0 76.3 

2 0.367879 171.8 35.1 

3 0.692201 46.9 22.1 

4 0.500473 38.3 11.8 

5 0.606244 17.4 6.89 
6 0.545396 11.2 3.83 
7 0.579612 5.90 2.20 
8 0.560115 3.48 1.24 
9 0.571143 1.93 0.705 
10 0.564879 1.11 0.399 


, 


De esta manera, se puede observar que cada iteración acerca cada vez más el valor aproximado al 
valor verdadero de la raíz: 0.567143209. 


6.1.1 Convergencia 


Note que el error relativo porcentual verdadero en cada iteración del ejemplo 6.1 es más o menos pro- 
porcional (por un factor de 0.5 a 0.6) al error de la iteración anterior. Esta propiedad, conocida como 
convergencia lineal, es característica de la iteración de punto fijo. 

Además de la “velocidad” de convergencia, en este momento debemos enfatizar la “posibilidad” 
de convergencia. Los conceptos de convergencia y divergencia se pueden ilustrar gráficamente. 
Recuerde que en la sección 5.1 se graficó una función para visualizar su estructura y comportamien- 
to (ejemplo 5.1). Ese método se emplea en la figura 6.2a para la función f(x) = e” — x. Un método 
gráfico alternativo consiste en separar la ecuación en dos partes, de esta manera 


F0) =$) 
Entonces las dos ecuaciones 


y =4100 (6.3) 


Y. = 0) (6.4) 
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se grafican por separado (figura 6.2b). Así, los valores de x correspondientes a las intersecciones de 
estas dos funciones representan las raíces de f(x) = 0. 
EJEMPLO 6.2 El método gráfico de las dos curvas 


Planteamiento del problema Separe la ecuación e — x= 0 en dos partes y determine su raíz 
en forma gráfica. 


Solución Reformule la ecuación como y, = x y y, = e”. Al tabular las funciones se obtienen los 
siguientes valores: 


x Y1 Y2 
0.0 0.0 1.000 
0.2 0.2 0.819 
0.4 0.4 0.670 
0.6 0.6 0.549 
0.8 0.8 0.449 


1.0 1.0 0.368 


Estos puntos se grafican en la figura 6.2b. La intersección de las dos curvas indica una raíz estima- 
da de aproximadamente x = 0.57, que corresponde al valor donde la curva de la figura 6.2a cruza el 
eje x. 


El método de las dos curvas también se utiliza para ilustrar 
la convergencia y divergencia de la iteración de punto fijo. En F0) 
primer lugar, la ecuación (6.1) se reexpresa como un par de ecua- 
ciones y; = x y y, = g(x). Estas dos ecuaciones se grafican por 
separado. Como en el caso de las ecuaciones (6.3) y (6.4), las 
raíces de f(x) = O corresponden al valor de la abscisa en la inter- 
sección de las dos curvas. En la figura 6.3 se grafican la función 
y = x y cuatro formas diferentes de la función y, = g(x). 

En el primer caso (figura 6.3a), el valor inicial x, sirve para 
determinar el punto [xo, 2(%p)] correspondiente a la curva y,. El 
punto (x,, x,) se encuentra moviéndose horizontalmente a la 1z- 
quierda hasta la curva y,. Estos movimientos son el equivalente a 
la primera iteración en el método de punto fijo: 


=Y 


Fx) 


xy = 8010) 


De esta manera, tanto en la ecuación como en la gráfica se usa un 
valor inicial xy para obtener una aproximación de x¡. La siguiente 
iteración consiste en moverse al punto [x,, g(x;)] y después a 
(x>, x2). Esta iteración es equivalente a la ecuación: 


x= g(x1) 


=Y 


La solución en la figura 6.3a es convergente, ya que la aproxi- 
mación de x se acerca más a la raíz con cada iteración. Lo mismo 
ocurre en la figura 6.3b. Sin embargo, éste no es el caso en las Figura 6.2 

figuras 6.3c y 6.3d, donde las iteraciones divergen de la raíz. Dos métodos gráficos para determinar la raíz de fa) = e*—x. 
Observe que la convergencia ocurre únicamente cuando el valor a) La raíz como un punto donde la función cruza el eje x; 
absoluto de la pendiente de y,= g(x) es menor al valor de la pb) la raíz como la intersección de las dos funciones compo- 
pendiente de y, = x, es decir, cuando |g"(x)| < 1. En el cuadro 6.1  nentes. 

se presenta un desarrollo teórico de este resultado. 
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Cuadro 6.1 Convergencia de la iteración de punto fijo 


Al analizar la figura 6.3, se debe notar que la iteración de punto fijo 
converge si, en la región de interés, | g'(x) | < 1. En otras palabras, 
la convergencia ocurre si la magnitud de la pendiente de g(x) es 
menor que la pendiente de la recta f(x) = x. Esta observación puede 
demostrarse teóricamente. Recuerde que la ecuación iterativa es 


Xi 1 = 8(%)) 
Suponga que la solución verdadera es 
X, = 8(4,) 
Al restar estas dos ecuaciones se obtiene 


Xp —Xi41 = 8(%,) — 8%) (C6.1.1) 


El teorema del valor medio de la derivada (recuerde la sección 4.1.1) 
establece que si una función g(x) y su primera derivada son continuas 
en un intervalo a < x < b, entonces existe al menos un valor de x= ¿ 
dentro del intervalo para el que 


R 8(b) — g(a) 
b-a 


8 (E) (C6.1.2) 


El lado derecho de esta ecuación es la pendiente de la recta que une 
a g(a) y g(b). Así, el teorema del valor medio establece que existe al 
menos un punto entre a y b que tiene una pendiente, denotada por 
2 (8), que es paralela a la línea que une g(a) con g(b) (recuerde la 
figura 4.3). 


Ahora, si se hace a= x;, y b= x,, el lado derecho de la ecuación 
(C6.1.1) se expresa como 


8(x,) = 8(x;) = (x, NN x)g (E) 
donde £ se encuentra en alguna parte entre x; y x,. Este resultado se 
sustituye en la ecuación (C6.1.1) para obtener 


X, —=Xj21 = (x,— x)8"(É) (C6.1.3) 


Si el error verdadero en la iteración ¡ se define como 
Ei =X,=X; 
entonces la ecuación (C6.1.3) se convierte en 


Envie = E EJE, 


En consecuencia, si | 2 (0) | < 1, entonces los errores disminuyen con 
cada iteración. Si | 09) | > 1, los errores crecen. Observe también 
que si la derivada es positiva, los errores serán positivos y, por lo 
tanto, la solución iterativa será monótona (figuras 6.3a y 6.3c). Si la 
derivada es negativa, entonces los errores oscilarán (figuras 6.3b y 
6.3d). 

Un corolario de este análisis establece que cuando el método 
converge, el error es proporcional y menor que el error en la iteración 
anterior. Por tal razón se dice que la iteración simple de punto fijo es 
linealmente convergente. 


Y, = 8%) 


=Y 


Figura 6.3 

Redes de iteración que describen la convergencia (a 
y b) y la divergencia (c y d) de la iteración simple de 
punto fijo. Las gráficas a) y c) tienen un comporta- 
miento monótono; mientras que b) y d) tienen un 


comportamiento oscilatorio o en espiral. Deberá notar 
que la convergencia se obtiene cuando l8'0o] <1. 
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6.1.2 Algoritmo para la iteración de punto fijo 


El algoritmo para la iteración de punto fijo es simple en extremo. Consta de 
un loop o ciclo que calcula en forma iterativa nuevas aproximaciones hasta 
satisfacer el criterio de terminación. En la figura 6.4 se muestra el pseu- 
docódigo para el algoritmo. Se pueden programar de manera similar otros 
métodos abiertos, la modificación principal consiste en cambiar la fórmula 
iterativa que se utiliza para calcular la nueva raíz. 


6.2 MÉTODO DE NEWTON-RAPHSON 


Tal vez, de las fórmulas para localizar raíces, la fórmula de Newton-Raph- 
son (figura 6.5) sea la más ampliamente utilizada. Si el valor inicial para la 
raíz es x;, entonces se puede trazar una tangente desde el punto [x,, f(xx,)] . 
Por lo común, el punto donde esta tangente cruza al eje x representa una 
aproximación mejorada de la raíz. 

El método de Newton-Raphson se deduce a partir de esta interpretación 
geométrica (un método alternativo basado en la serie de Taylor se describe 
en el cuadro 6.2). De la figura 6.5, se tiene que la primera derivada en x es 
equivalente a la pendiente: 


Fx) 0 (6.5) 


XX ¡41 


FG) = 
que se arregla para obtener 


IO (6.6) 


Xi4 i , 
F(x,) 


la cual se conoce como fórmula de Newton-Raphson. 


EJEMPLO 6.3 Método de Newton-Raphson 


Planteamiento del problema Utilice el método de Newton-Raphson 
para calcular la raíz de f(x) = e”* — x empleando como valor inicial xy = 0. 


Solución La primera derivada de la función es 


FO)=-e*-1 


que se sustituye, junto con la función original en la ecuación (6.6), para 
tener 
evi == 


E 
Xi4 1 2 AG . 
e —1 


FUNCTION Fixpt(x0, es, imax ¡ter, ea) 
xr= x0 
iter= 0 
DO 
xrold = xr 
xr = gíxrold) 
¡ter = ¡ter + 1 
IF- xr 0 THEN 


xr=xrold 
ea = ¡| 


2100 
xr 
END IF 
IF ea< es OR ¡ter 2 ¡max EXIT 
END DO 
Fixpt = xr 
END Fixpt 


Figura 6.4 

Pseudocódigo para la iteración de punto fijo. 
Note que otros métodos abiertos pueden dise- 
ñarse en este formato general. 


FO 4 


Pendiente = f'(x;) 


FG) 


Figura 6.5 

Representación gráfica del método de Newton- 
Raphson. Se extrapola una tangente a la función 
en x; [esto es, f'(x,)] hasta el eje x para obtener 
una estimación de la raíz en x,, ;. 


Empezando con un valor inicial xy = 0, se aplica esta ecuación iterativa para calcular 


X¡ er(%) 


i 

0 0 100 

1 0.500000000 11.8 

2 0.566311003 0.147 

3 0.567143165 0.0000220 
4 


0.567143290 < 10% 
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Así, el método converge rápidamente a la raíz verdadera. Observe que el error relativo porcentual 
verdadero en cada iteración disminuye mucho más rápido que con la iteración simple de punto fijo 
(compare con el ejemplo 6.1). 


6.2.1 Criterio de terminación y estimación de errores 


Como en los otros métodos para localizar raíces, la ecuación (3.5) se utiliza como un criterio de ter- 
minación. No obstante, el desarrollo del método con base en la serie de Taylor (cuadro 6.2) proporcio- 
na una comprensión teórica respecto a la velocidad de convergencia expresada por E;,, ¡| = O(E?). 
De esta forma, el error debe ser más o menos proporcional al cuadrado del error anterior. En otras 
palabras, el número de cifras significativas de precisión aproximadamente se duplica en cada itera- 
ción. Dicho comportamiento se examina en el siguiente ejemplo. 


EJEMPLO 6.4 Análisis de error en el método de Newton-Raphson 
Planteamiento del problema Como se dedujo del cuadro 6.2, el método de Newton-Raphson 
es convergente en forma cuadrática. Es decir, el error es más o menos proporcional al cuadrado del 


error anterior: 


f (6) E, (E6.4.1) 
2f'(x,) 


Examine esta fórmula y observe si concuerda con los resultados del ejemplo 6.3. 


ti+1= 


Solución La primera derivada de f(x) = e*—xes 
fm =->e*-1 

que se evalúa en x, = 0.56714329 para dar f'(0.56714329) = -1.56714329. La segunda derivada es: 
f(x) =e> 


la cual se evalúa como f”(0.56714329) = 0.56714329. Estos resultados se sustituyen en la ecuación 
(E6.4.1): 
E 0.56714329 


Ens = E?, = 0.18095E?, 
2(-1.56714329) 


En el ejemplo 6.3, el error inicial fue E, y = 0.56714329, el cual se sustituye en la ecuación de error 
que predice 


E, = 0.18095(0.56714329)? = 0.0582 
que es cercano al error verdadero de 0.06714329. En la siguiente iteración, 
E, S 0.18095(0.06714329)? = 0.0008158 


que también se compara de manera favorable con el error verdadero 0.0008323. Para la tercera ite- 
ración, 

E, 3 = 0.18095(0.0008323)? = 0.000000125 
que es el error obtenido en el ejemplo 6.3. Así, la estimación del error mejora, ya que conforme nos 


acercamos a la raíz, x y É se aproximan mejor mediante x, [recuerde nuestra suposición al ir de la 
ecuación (C6.2.5) a la ecuación (C6.2.6) en el cuadro 6.2]. Finalmente: 


E, = 0.18095(0.000000125)? = 2.83 x 10715 


Así, este ejemplo ilustra que el error en el método de Newton-Raphson para este caso es, de hecho, 
proporcional (por un factor de 0.18095) al cuadrado del error en la iteración anterior. 
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Cuadro 6.2 Deducción y análisis del error del método de Newton-Raphson 


Además de la deducción geométrica [ecuaciones (6.5) y (6.6)], el 
método de Newton-Raphson también se desarrolla a partir de la ex- 
pansión de la serie de Taylor. Esta deducción alternativa es muy útil 
en el sentido de que provee cierta comprensión sobre la velocidad de 
convergencia del método. 

Recuerde del capítulo 4 que la expansión de la serie de Taylor se 
puede representar como 


Hr) RA) A POD Ox) 
FE) 


= (C6.2.1) 


+ (1 AY? 


donde éÉ se encuentra en alguna parte del intervalo desde x, hasta x;,. 
Truncando la serie de Taylor después del término de la primera de- 
rivada, se obtiene una versión aproximada: 


AA+ 1) S AR) E Ax; 


En la intersección con el eje x, f(x; ¡) debe ser igual a cero, o 


0O= Ax) + FA, —x) (C6.2.2) 


de donde se puede despejar 


Ñ Ax) 
Fx) 


que es idéntica a la ecuación (6.6). De esta forma, se ha deducido la 
fórmula de Newton-Raphson usando una serie de Taylor. 

Además de este desarrollo, la serie de Taylor sirve para estimar 
el error de la fórmula. Esto se logra observando que si se utilizan 
todos los términos de la serie de Taylor se obtendrá un resultado 
exacto. En tal situación x;, ¡ = x,, donde x es el valor verdadero de la 


Xi4 1 = Xi 


raíz. Sustituyendo este valor junto con Ax,)=0 en la ecuación (C6.2.1) 
se obtiene 


FE) 
21 


(C6.2.3) 


(x, > xy 


0= Ax) + Fc) (x,—x;) + 


La ecuación (C6.2.2) se resta de la ecuación (C6.2.3) para 
obtener 


0O= Fa, —x;+ 1) + ¿xP (C6.2.4) 


FUE) 
(x 
2! 


Ahora, observe que el error es igual a la diferencia entre x;,, y el 
valor verdadero x,, como en 


Enira= X= Xi41 


y la ecuación (C6.2.4) se expresa como 


Es (C6.2.5) 


Si se supone que hay convergencia, entonces tanto x, como É se de- 
berán aproximar a la raíz x, y la ecuación (C6.2.5) se reordena para 
obtener 


e 
_ —f (x,) El 
1142127 E 
2f(x,) 
De acuerdo con la ecuación (C6.2.6), el error es proporcional al 
cuadrado del error anterior. Esto significa que el número de cifras 
decimales correctas aproximadamente se duplica en cada iteración. 
A este comportamiento se le llama convergencia cuadrática. El 
ejemplo 6.4 ilustra esta propiedad. 


(C6.2.6) 


6.2.2 Desventajas del método de Newton-Raphson 


Aunque en general el método de Newton-Raphson es muy eficiente, hay situaciones donde se com- 
porta de manera deficiente. Por ejemplo, en el caso especial de raíces múltiples que se analizará más 
adelante en este capítulo. Sin embargo, también cuando se trata de raíces simples, se encuentran 


dificultades, como en el siguiente ejemplo. 


EJEMPLO 6.5 Ejemplo de una función que converge lentamente con 


el método de Newton-Raphson 


Planteamiento del problema Determine la raíz positiva de f(x) = x!% — 1 usando el método de 


Newton-Raphson y un valor inicial x = 0.5. 


Solución La fórmula de Newton-Raphson en este caso es: 


10 
x, —1 


10x? 


Xi41 XA 


que se utiliza para calcular: 
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Iteración xXx 
0 0.5 
1 51.65 
2 46.485 
3 41.8365 
4 37.65285 
5 33.887565 


00 1.0000000 


De esta forma, después de la primera predicción deficiente, la técnica converge a la raíz verdadera, 
1, pero muy lentamente. 


Además de la convergencia lenta debido a la naturaleza de la función, es posible que se presen- 
ten otras dificultades, como se ilustra en la figura 6.6. Por ejemplo, la figura 6.6a muestra el caso 
donde un punto de inflexión [esto es, f”(x) = 0] ocurre en la vecindad de una raíz. Observe que las 
iteraciones que empiezan con xp divergen progresivamente de la raíz. En la figura 6.6b se ilustra la 
tendencia del método de Newton-Raphson a oscilar alrededor de un mínimo o máximo local. Tales 
oscilaciones pueden persistir o, como en la figura 6.6b, alcanzar una pendiente cercana a cero, des- 
pués de lo cual la solución se aleja del área de interés. En la figura 6.6c se muestra cómo un valor 
inicial cercano a una raíz salta a una posición varias raíces más lejos. Esta tendencia a alejarse del 

área de interés se debe a que se encuentran pendientes cercanas 

a cero. En efecto, una pendiente cero [f'(x) = 0] es un verdadero 
Fm desastre, ya que causa una división entre cero en la fórmula de 
Newton-Raphson [ecuación (6.6)]. En forma gráfica (figura 6.6d), 
esto significa que la solución se dispara horizontalmente y jamás 
toca al eje x. 

De manera que no hay un criterio general de convergencia 
para el método de Newton-Raphson. Su convergencia depende de 
la naturaleza de la función y de la exactitud del valor inicial. La 
única solución en estos casos es tener un valor inicial que sea 
“suficientemente” cercano a la raíz. ¡Y para algunas funciones 
ningún valor inicial funcionará! Los buenos valores iniciales por 
lo común se predicen con un conocimiento del problema físico o 
mediante el uso de recursos alternativos, como las gráficas, que 
proporcionan mayor claridad en el comportamiento de la solución. 
Ante la falta de un criterio general de convergencia se sugiere el 
diseño de programas computacionales eficientes que reconozcan 
la convergencia lenta o la divergencia. La siguiente sección está 
enfocada hacia dichos temas. 


FO 


Figura 6.6 
x Cuatro casos donde el método de Newton-Raphson exhibe una 
convergencia deficiente. 


SUoe==> 
= 


6.3 El método de la secante 


6.2.3 Algoritmo para el método de Newton-Raphson 


Un algoritmo para el método de Newton-Raphson se obtiene fácilmente al sustituir la ecuación (6.6) 
por la fórmula predictiva [ecuación (6.2)] en la figura 6.4. Observe, sin embargo, que el programa 
también debe modificarse para calcular la primera derivada. Esto se logra incluyendo simplemente 
una función definida por el usuario. 

Además, a la luz del análisis anterior sobre los problemas potenciales del método de Newton- 
Raphson, el programa se podría mejorar incorporando algunas consideraciones adicionales: 


1. Se debe incluir una rutina de graficación en el programa. 

2. Al final de los cálculos, se necesitará sustituir siempre la raíz final calculada en la función 
original, para determinar si el resultado se acerca a cero. Esta prueba protege el desarrollo del 
programa contra aquellos casos en los que se presenta convergencia lenta u oscilatoria, la cual 
puede llevar a valores pequeños de e,, mientras que la solución aún está muy lejos de una raíz. 

3. El programa deberá incluir siempre un límite máximo permitido del número de iteraciones para 
estar prevenidos contra soluciones oscilantes, de lenta convergencia o divergentes que podrían 
persistir en forma interminable. 

4. El programa deberá alertar al usuario para que tome en cuenta la posibilidad de que f'(x) sea 
igual a cero en cualquier momento durante el cálculo. 


6.3 EL MÉTODO DE LA SECANTE 


Un problema potencial en la implementación del método de Newton-Raphson es la evaluación de la 
derivada. Aunque esto no es un inconveniente para los polinomios ni para muchas otras funciones, 
existen algunas funciones cuyas derivadas en ocasiones resultan muy difíciles de calcular. En dichos 
casos, la derivada se puede aproximar mediante una diferencia finita dividida hacia atrás, como en 
(figura 6.7) 


FG, )-Jf(x,) 


Xp 1 A; 


+ — 
F (x,) = 
Esta aproximación se sustituye en la ecuación (6.6) para obtener la siguiente ecuación iterativa: 


FO), =x,) 


1 = x= 6.7 
AO pe 


La ecuación (6.7) es la fórmula para el método de la secante. Observe que el método requiere de dos 
valores iniciales de x. Sin embargo, debido a que no se necesita que f(x) cambie de signo entre los va- 
lores dados, este método no se clasifica como un método cerrado. 


EJEMPLO 6.6 El método de la secante 


Planteamiento del problema Con el método de la secante calcule la raíz de f(x) = e*—x. 
Comience con los valores iniciales x_, =0 y xy = 1.0. 


Solución Recuerde que la raíz real es 0.56714329... 
Primera iteración: 


x,=0 F(x_1) = 1.00000 

Xo =1 fo) =-0.63212 

x=1 a O e, =8.0% 
1 - (-0.63212) 


Segunda iteración: 
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A Figura 6.7 


Representación gráfica del método de la secante. Esta técnica es 
similar a la del método de Newton-Raphson (figura 6.5) en el senti- 
do de que una aproximación de la raíz se predice extrapolando una 


de tangente de la función hasta el eje x. Sin embargo, el método de 
la secante usa diferencias divididas en lugar de una derivada para 
estimar la pendiente. 
x=1 FG) = 0.63212 
x¡ =0.61270 FG) =-0.07081 


(Note que ambas aproximaciones se encuentran del mismo lado de la raíz.) 


—0.07081 (1 - 0.61270) 


xo, =0.61270 70.63212-0.07081) = 0.56384 e,= 0.58% 
Tercera iteración: 

x¡ =0.61270 Kx¡) =-0.07081 

x2 = 0.56384 Kx>) = 0.00518 


.00518(0.61270 —0. 4 
x3 = 0.56384 Da e A =0.56717 e, = 0.0048% 
—0.07081-— (-0.00518) 


6.3.1 Diferencia entre los métodos de la secante y de la falsa posición 


Observe la similitud entre los métodos de la secante y de la falsa posición. Por ejemplo, las ecuacio- 
nes (5.7) y (6.7) son idénticas en todos los términos. Ambas usan dos valores iniciales para calcular 
una aproximación de la pendiente de la función que se utiliza para proyectar hacia el eje x una nue- 
va aproximación de la raíz. Sin embargo, existe una diferencia crítica entre ambos métodos. Tal 
diferencia estriba en la forma en que uno de los valores iniciales se reemplaza por la nueva aproxi- 
mación. Recuerde que en el método de la falsa posición, la última aproximación de la raíz reempla- 
za a cualquiera de los valores iniciales que dé un valor de la función con el mismo signo que f(x,). 
En consecuencia, las dos aproximaciones siempre encierran a la raíz. Por lo tanto, para todos los 
casos, el método siempre converge, pues la raíz se encuentra dentro del intervalo. En contraste, el 
método de la secante reemplaza los valores en secuencia estricta: con el nuevo valor x;, , se reem- 
plaza a x, y x, reemplaza a x;_ ¡. En consecuencia, algunas veces los dos valores están en el mismo 
lado de la raíz. En ciertos casos esto puede llevar a divergencias. 


EJEMPLO 6.7 Comparación de la convergencia en los métodos de la secante 
y de la falsa posición 


Planteamiento del problema Utilice los métodos de la secante y de la falsa posición para calcular 
la raíz de f(x) = In x. Empiece los cálculos con los valores iniciales x,=x,_¡ =0.5 y x, =x,= 5.0. 
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Solución En el método de la falsa posición, con el uso de la ecuación (5.7) y los criterios del in- 
tervalo para el reemplazo de las aproximaciones, se obtienen las siguientes iteraciones: 
Iteración Xx Xu Xx, 
0.5 5.0 1.8546 
0.5 1.8546 1.2163 
3 0.5 1.2163 1.0585 
Como se observa (figuras 6.8a y c), las aproximaciones van convergiendo a la raíz exacta que es igual 
al. 
En el método de la secante, con el uso de la ecuación (6.7) y el criterio secuencial para el reem- 
plazo de las aproximaciones, se obtiene: 
Iteración Xi-1 Xi Xi 1 
0:5 5.0 1.8546 
2 5.0 1.8546 -0.10438 
Como se muestra en la figura 6.8d, el método es divergente. 
Falsa posición Secante 
FA FA.) 0) 4 F;) FO) 4 FA F-1) 
Fx;) 
*x, 
Ly x x 
F1) 
a) b) c) d) 
Figura 6.8 


Comparación entre los métodos de la falsa posición y de la secante. Las primeras iteraciones a) y b) de 
ambos métodos son idénticas. No obstante, en las segundas iteraciones c) y a), los puntos usados son 
diferentes. En consecuencia, el método de la secante llega a diverger, como se indica en d). 


Aunque el método de la secante sea divergente, cuando converge lo hace más rápido que el 
método de la falsa posición. Por ejemplo, en la figura 6.9 se muestra la superioridad del método de 
la secante. La inferioridad del método de la falsa posición se debe a que un extremo permanece fijo 
para mantener a la raíz dentro del intervalo. Esta propiedad, que es una ventaja porque previene la 
divergencia, tiene una desventaja en relación con la velocidad de convergencia; esto hace de la dife- 
rencia finita estimada una aproximación menos exacta que la derivada. 


6.3.2 Algoritmo para el método de la secante 


Como con los otros métodos abiertos, el algoritmo del método de la secante se obtiene simplemente 
modificando la figura 6.4, de tal forma que se puedan introducir dos valores iniciales, y usando la 
ecuación (6.7) se calcule la raíz. Además, las opciones sugeridas en la sección 6.2.3 para el método 
de Newton-Raphson, también se pueden aplicar para obtener ventajas al programa de la secante. 
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Comparación de los errores relativos porcentuales verdade- 
ros € ;, para los métodos que determinan las raíces de f(x) 
=e*-x. 


0.01-0.63212) 


6.3.3 Método de la secante modificado 


En lugar de usar dos valores arbitrarios para aproximar la deriva- 
da, un método alternativo considera un cambio fraccionario de la 
variable independiente para estimar f'Qo), 


fa) Fo, + 0x,) = f(x,) 
Óx, 


i 


donde d es un pequeño cambio fraccionario. Esta aproximación 
se sustituye en la ecuación (6.6) que da la siguiente ecuación 
iterativa: 


E Óx, f(x.) 
0 A +) f(x) 


(6.8) 


EJEMPLO 6.8 Método de la secante modificado 


Planteamiento del problema Con el método de la secante 
modificado estime la raíz de f(x) = e”* — x. Use un valor de 0.01 
para Ó y comience con xy = 1.0. Recuerde que la raíz verdadera es 
0.56714329... 


Solución 


Primera iteración: 


—0.64578 — (-0.63212) 


Segunda iteración: 
Xy = 0.537263 
Xp + ÓXxp = 0.542635 


0.005373(0.047083) 


x¡ =0.537263 


xo =1 Roo) =-0.63212 
Xo0 + ÓXo = 1.01 FO + Óxp) = —0.64578 
= 0.537263 le, | =5.3% 
Roo) = 0.047083 
Roo + Óxo) =0.038579 
=0.56701 le,| =0.0236% 


0.038579 — 0.047083 


Tercera iteración: 
Xy = 0.56701 
Xp + Óxp = 0.572680 


x, =0.56701 


0.00567(0.000209) 


f%) = 0.000209 


foo + Óxp) =-0.00867 


=0.567143 — le, | =2.365x 105% 


—0.00867 — 0.000209 


La elección de un valor adecuado para d no es automática. Si d es muy pequeño, el método 
puede no tener éxito por el error de redondeo, causado por la cancelación por resta en el denomina- 
dor de la ecuación (6.8). Si ésta es muy grande, la técnica puede llegar a ser ineficiente y hasta di- 
vergente. No obstante, si se selecciona correctamente, proporciona una adecuada alternativa en los 


casos donde la evaluación de la derivada se dificulta y el desarro- 
llo de dos valores iniciales es inconveniente. 


6.4 MÉTODO DE BRENT 


¿No sería agradable tener un método híbrido que combinara la 
confiabilidad del agrupamiento en regiones con la rapidez de los 
métodos abiertos? El método de Brent de ubicación de raíces es 
un ingenioso algoritmo que hace exactamente eso mediante la 
aplicación de un rápido método abierto siempre que sea posible, 
pero volviendo al confiable método de agrupamiento en regiones 
cuando sea necesario. Este método lo desarrolló Richard Brent 
(1973), con base en un algoritmo anterior de Theodorus Dekker 
(1969). 

La técnica de agrupamiento en regiones es el confiable mé- 
todo de bisección (sección 5.2), mientras que se usan dos métodos 
abiertos distintos. El primero es el método de la secante descrito 
en la sección 6.3. Como se explica en seguida, el segundo es la 
interpolación inversa cuadrática. 


6.4.1 Interpolación inversa cuadrática 


La interpolación inversa cuadrática se basa en una idea similar 
a la del método de la secante. Como en la figura 6.10a, el método 
de la secante es el cálculo de una línea recta que pasa por dos 
valores iniciales. La intersección de esta línea recta con el eje x 
representa el nuevo estimado de la raíz. Por esta razón, algunas 
veces se le describe como un método de interpolación lineal. 

Ahora suponga que se tienen tres puntos. En este caso, se 
puede determinar una función cuadrática de x que pase por los 
tres puntos (figura 6.10b). Exactamente igual que con el método 
de la secante lineal, la intersección de esta parábola con el eje x 
representaría el nuevo estimado de la raíz. Y, como se ilustra en 
la figura 6.10b, usar una curva en vez de una línea recta a me- 
nudo produce un mejor estimado. 

Aunque esto parecería representar una gran mejora, el méto- 
do tiene una falla fundamental: ¡es posible que la parábola no 
interseque el eje x! Éste sería el caso cuando la parábola resultan- 
te tenga raíces complejas. Esto se ilustra por la parábola y = f(x), 
en la figura 6.11. 
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Comparación de a) el método de la secante y b) interpola- 
ción inversa cuadrática. Observe que la parábola negra que 
pasa por los tres puntos en b) se llama “inversa” porque se 


escribe en y en vez de en x. 


La dificultad se puede corregir usando la interpolación inversa cuadrática. Es decir, en lugar de 
usar una parábola en x, se pueden ubicar los puntos en una parábola en y. Esto equivale a invertir los 
ejes y crear una parábola “ladeada” [la curva x = (y) en la figura 6.11]. 

Si los tres puntos se designan como (x;_», Y;¡_2), (%;_ 1, Y;_ 1) y (X;, y;¡), se puede generar una fun- 


ción cuadrática de y que pase por los puntos como 


== DO == yi) O = JO — y) 


8) = CA) q Oia YiJ O 


= y;) 
O=Y-DO = Yi-1) 


i21 


O Yi-DO — JYi-1) 


(6.9) 


Como se verá en la sección 18.2, esta forma se llama un polinomio de Lagrange. La raíz, X;, ¡, 


corresponde a y = 0, que, al sustituirse en la ecuación (6.9), da 
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Z Yi-1Yi Sade Yi-2Yi a 
+1 = ¡2 iS 
Y Oia-400i2=3)" Oia —Yi-dO0i-1 Y) 


e a * (6.10) 
Oi — Yi-2J0 — Yi-1) 


Como se muestra en la figura 6.11, una parábola “ladeada” como ésta siempre interseca el eje x. 


Figura 6.11 

Dos parábolas que pasen por tres puntos. Parábolas escritas 
como función de x, y =f(x), tiene raíces complejas y por lo 
tanto no interseca el eje x. En contraste, si las variables se in- 
vierten y se desarrolla la parábola como x= f(y), la función sí 
las interseca el eje x. 


=Y 


EJEMPLO 6.9 Interpolación cuadrática inversa 


Planteamiento del problema  Desarrolle ecuaciones cuadráticas tanto en x como en y para los 
puntos de datos descritos en la figura 6.11: (1, 2), G, 1) y (4, 5). Para el primer caso, y =f(x), use la 
fórmula cuadrática para ilustrar que las raíces son complejas. Para el segundo caso, x = g(y), use 
la interpolación cuadrática inversa [ecuación (6.10)] para determinar el estimado de raíces. 


Solución Invirtiendo las x y las y, se puede usar la ecuación (6.9) para generar una cuadrática en 
x como 

(x — 2)(x — 4) (x— 1) (x —4) (x— 1)(x — 2) 

ad -2d-4) Q-DQ0-4) (4- D(4-2) 


f(x) = 


o, agrupando términos, 
fa) =x2-4x+5 


Esta ecuación se usó para generar la parábola, y = f(x) en la figura 6.11. Se puede usar la fórmula 
cuadrática para determinar que las raíces, en este caso, son complejas, 


—4 y? — 
a — AMÓ gs 


La ecuación (6.9) se puede usar para generar la cuadrática en y como 


(Y — DG — 5) G -—2)( — 5) G-260-1) 
Q-1DQ-S5) (1-21 —5) 6-26 -—1) 


80) = 
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o, agrupando términos, 
2(y) =0.51? —2.5x +4 
Finalmente, se puede usar la ecuación (6.10) para determinar la raíz como 


-1(=5) —-2(-5) -2(-1) 


“e E-De-5  1-D4-5 6-26-D 


Antes de proseguir con el algoritmo de Brent, se necesita mencionar otro caso en el que no fun- 
ciona la interpolación cuadrática inversa. Si los tres valores de y no son distintos (es decir, y;_, = 
Y¡-10 y¡_1 =)/), no existe una función cuadrática inversa. De modo que aquí es donde entra en juego 
el método de la secante. Si se llega a una situación en la que los valores de y no son distintos, se 
puede siempre volver al método menos eficiente de la secante para generar una raíz usando dos de 
los puntos. Si y;_, = y;_ ¡, se usa el método de la secante con x;_¡ Y X;. Sl y;_ ¡ = Jj, Se USA X¡_2Y X;_ 1» 


6.4.2 Algoritmo del método de Brent 


La idea general respecto al método de Brent para la ubicación de raíces es, siempre que sea posible, 
usar uno de los métodos rápidos abiertos. En el caso de que esto genere un resultado inaceptable (es 
decir, un estimado de raíces que caiga fuera de la región seleccionada), el algoritmo vuelve al mé- 
todo más conservador de bisección. Aunque el método de bisección puede ser más lento, genera un 
estimado con garantía de caer dentro de la región. Este proceso se repite luego hasta que la raíz se 
ubique dentro de una tolerancia aceptable. Como podría esperarse, al principio domina usualmente 
la bisección, pero al acercarse a la raíz, la técnica cambia a los métodos abiertos más rápidos. 

La figura 6.12 presenta el pseudocódigo para el algoritmo basado en el archivo M de MATLAB 
desarrollado por Cleve Moler (2005). Representa una versión simplificada de la función £zero, 
que es la función profesional para ubicación de raíces que se emplea en MATLAB. Por esta razón, 
la versión simplificada se llama £zerosimp. Observe que necesita otra función, f, para mante- 
ner la ecuación para la cual se está evaluando la raíz. 

La función fzerosimp se pasa por dos valores iniciales entre los que debe estar comprendida 
la raíz. Después de asignar valores para la épsilon de la máquina y para una tolerancia, las tres va- 
riables que definen el intervalo de búsqueda (a, b, Cc) se inicializan y se evalúa £ en los puntos 
finales. 

En seguida se implementa un ciclo principal si es necesario, se reordenan los tres puntos para 
satisfacer las condiciones necesarias para que el algoritmo funcione eficazmente. En este punto, si 
se cumplen los criterios de detención, se termina el ciclo. De otra manera, una estructura de decisión 
elige entre los tres métodos y verifica si el resultado es aceptable. Luego, una sección final evalúa £ 
en el punto nuevo y se repite el ciclo. Una vez que se cumplen los criterios de detención, el ciclo 
termina y se devuelve el estimado final de raíces. 

Observe que la sección 7.7.2 presenta una aplicación del método de Brent en la que se ilustra 
cómo trabaja la función £zero de MATLAB. Además, se usa en el estudio de caso 8.4 para deter- 
minar el factor de fricción para flujo de aire por un tubo. 


6.5 RAÍCES MÚLTIPLES 


Una raíz múltiple corresponde a un punto donde una función es tangencial al eje x. Por ejemplo, una 
raíz doble resulta de 


ÍA) =(U- 3) - 1D) 1D) (6.11) 


o, multiplicando términos, f(x) =x? — 5x? + 7x— 3. La ecuación tiene una raíz doble porque un valor de 
x hace que dos términos de la ecuación (6.11) sean iguales a cero. Gráficamente, esto significa que 
la curva toca en forma tangencial al eje x en la raíz doble. Observe la figura 6.13a en x= 1. Note que la 
función toca al eje pero no lo cruza en la raíz. 
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Figura 6.12 
Pseudocódigo para 

el algoritmo de Brent 
para búsqueda de 
raíces basado en un 
archivo M de MATLAB 
desarrollado por Cleve 
Moler (2005). 
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Function fzerosimp(xl, xu) 
eps = 2.22044604925031E-16 
tol = 0.000001 
a= xl: b= xu: fa= fía): fb= f(b) 
c=a:fo=fa:d=b-c:e=d 
DO 
IF fb= 0 EXIT 
IF Sgnífa) > Sgn(fb) THEN (Si es necesario reordene los puntos) 
a =cC: fa fc:d=b=c:e=d 
ENDIF 
IF |fa|] < |fb|] THEN 
c=b:b=a:a=cC 
fc = Fb: fb = fa: fa = fc 
ENDIF 
m= 0.5 * (a— b) (Fin de prueba y posible salida) 
tol = 2 * eps * max(|b|, 1) 
IF |m| < tol Or fb = 0. THEN 
EXIT 
ENDIF 
(Choose open methods or bisection) 


IF |e| = tol And |fc| > |fb| THEN 
s= fb/ fe 
IF a = Cc THEN (Método de la secante) 
p=2*m*s 
q=1=s 
ELSE (Interpolación cuadrática inversa) 


q=fc/ fa: r= fb/ fa 
DESFILE MEG Eg => TS M2 ER AE dd 
q=1(g=.1) * (=D *(s= 1) 
ENDIF 
IFp> 0 THEN q = —Q ELSE p = —p 
IF2*p<3*m*q= |tol * ql AND p< 0.5 * e * q] THEN 
e=d:d=p/qg 
ELSE 
d=m e=m 
ENDIF 
ELSE (Bisección) 
d=m e=.m 
ENDIF 
c=b:fc= fb 
IF |d| > tol THEN b= b+d Else b=b- Sgníb — a) * tol 
fb= f(b) 
ENDDO 
fzerosimp = b 
END fzerosimp 


Una raíz triple corresponde al caso en que un valor de x hace que tres términos en una ecuación 
sean iguales a cero, como en 


Áx) = 1-3) - DA DGA 1) 


o, multiplicando los términos, f(x) =1*— 6x7 + 121? — 10x + 3. Advierta que la representación gráfi- 
ca (figura 6.13b) indica otra vez que la función es tangente al eje en la raíz, pero que en este caso sí 
cruza el eje. En general, la multiplicidad impar de raíces cruza el eje, mientras que la multiplicidad 
par no lo cruza. Por ejemplo, la raíz cuádruple en la figura 6.13c no cruza el eje. 

Las raíces múltiples ofrecen algunas dificultades a muchos de los métodos numéricos expuestos 
en la parte dos: 


1. El hecho de que la función no cambie de signo en raíces múltiples pares impide confiarse de los 
métodos cerrados, que se analizan en el capítulo 5. Así, en los métodos incluidos en este texto, 
se está limitando a los abiertos que pueden ser divergentes. 


6.5 Raíces múltiples 


2. Otro posible problema se relaciona con el hecho de que no sólo f(x), sino también f'(x) se 
aproxima a cero en la raíz. Tales problemas afectan los métodos de Newton-Raphson y de la 
secante, los cuales contienen derivadas (o su aproximación) en el denominador de sus fórmulas 
respectivas. Esto provocará una división entre cero cuando la solución converge muy cerca de la 
raíz. Una forma simple de evitar dichos problemas, que se ha demostrado teóricamente (Ralston 
y Rabinowitz, 1978), se basa en el hecho de que f(x) siempre alcanzará un valor cero antes que 
F'Go). Por lo tanto, si se compara f(x) contra cero, dentro del programa, entonces los cálculos se 
pueden terminar antes de que f'(x) llegue a cero. 

3. Es posible demostrar que el método de Newton-Raphson y el método de la secante convergen 
en forma lineal, en vez de cuadrática, cuando hay raíces múltiples (Ralston y Rabinowitz, 1978). 
Se han propuesto algunas modificaciones para atenuar este problema. Ralston y Rabinowitz 
(1978) proponen que se realice un pequeño cambio en la formulación para que se regrese a la 
convergencia cuadrática, como en 


Fx) 
FG) 
donde m es la multiplicidad de la raíz (es decir, m =2 para una raíz doble, m = 3 para una raíz 


triple, etc.). Se trata de una alternativa poco satisfactoria, porque depende del conocimiento de 
la multiplicidad de la raíz. 


Xi] =X¡-M (6.12) 


Otra alternativa, también sugerida por Ralston y Rabinowitz (1978), consiste en definir una 
nueva función u(x), que es el cociente de la función original entre su derivada: 


70 
E) 
Se puede demostrar que esta función tiene raíces en las mismas posiciones que la función original. 


Por lo tanto, la ecuación (6.13) se sustituye en la ecuación (6.6) para desarrollar una forma alterna- 
tiva del método de Newton-Raphson: 


u(x) 


(6.13) 


Xj+ 1 =X (6.14) 


La ecuación (6.13) se puede diferenciar para obtener 


_ FOO) 


u'(x) (6.15) 
601 
Se sustituyen las ecuaciones (6.13) y (6.15) en la ecuación (6.14) y se simplifica el resultado: 
FAY) (6.16) 


+1 i 


FO EEE) 


EJEMPLO 6.10 Método de Newton-Raphson modificado para el cálculo 
de raíces múltiples 


Planteamiento del problema Con los dos métodos, el estándar y el modificado, de Newton- 
Raphson evalúe la raíz múltiple de la ecuación (6.11), use un valor inicial de xy = 0. 


Solución La primera derivada de la ecuación (6.11) es f'(x) = 3x? — 10x + 7, y por lo tanto, el 
método de Newton-Raphson estándar para este problema es [ecuación (6.6)] 


xx +7x,-3 
3x; —10x, +7 


Xi+1 2% 
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Figura 6.13 

Ejemplos de raíces múl- 
tiples que son tangen- 
ciales al eje x. Observe 
que la función no cruza 
el eje en los casos de 
raíces múltiples pares a) 
y C), mientras que con 
multiplicidad impar sí 
lo hace en b). 
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que se resuelve iterativamente para obtener 


¡ X; Es (%) 
0 0 100 

1 0.4285714 57 

2 0.6857143 31 

3 0.8328654 17 

4 0.9133290 8.7 
5 0.9557833 4.4 
6 0.9776551 2.2 


Como ya se había anticipado, el método converge en forma lineal hacia el valor verdadero 1.0. 
Para el caso del método modificado, la segunda derivada es f”(x) = 6x— 10, y en consecuencia 
la ecuación iterativa será [ecuación (6.16)] 


(51? +7x, - 3)Gx? -10x, +7) 
(3x; —10x, +7) —(x] —5x; +7x, — 3X6x, —10) 


que se resuelve para obtener 


Xi 15 


X; 


1 Xi; E (%) 


0 0 100 

1 1.105263 11 

2 1.003082 0.31 

3 1.000002 0.00024 


De esta manera, la fórmula modificada converge en forma cuadrática. Se pueden usar ambos 
métodos para buscar la raíz simple en x = 3. Con un valor inicial x, = 4 se obtienen los siguientes 
resultados: 


1] Estándar E¿(%) Modificado E (%) 
10) 4 33 4 33 

1 3.4 13 2.636364 12 

2 3.1 3.3 2.820225 6.0 

3 3.008696 0.29 2.961728 1.3 

4 3.000075 0.0025 2.998479 0.051 

5 


3.000000 2x107 2.999998 7.7x 107 


De esta forma, deberá notar que ambos métodos convergen con rapidez, aunque el método estándar 
es el más eficiente. 


En el ejemplo anterior se ilustran los factores de mayor importancia involucrados al elegir el 
método de Newton-Raphson modificado. Aunque es preferible para raíces múltiples, es menos efi- 
ciente y requiere más trabajo computacional que el método estándar para raíces simples. 

Se debe notar que hay manera de desarrollar una versión modificada del método de la secante 
para raíces múltiples, sustituyendo la ecuación (6.13) en la ecuación (6.7). La fórmula resultante es 
(Ralston y Rabinowitz, 1978) 


U(x, Mx; 1 —X,) 


u(x;_¡)-u(x;) 


Xi+1 AX 


6.6 Sistemas de ecuaciones no lineales 


6.6 SISTEMAS DE ECUACIONES NO LINEALES 


Hasta aquí nos hemos ocupado de determinar las raíces de una sola ecuación no lineal. Un problema 
relacionado con éste consiste en obtener las raíces de un conjunto de ecuaciones simultáneas, 


Jf(%1, X2»..., Xx) =0 
RG, Koaro. 20) = 0 


(6.17) 
$, (1, Marroo> a) = 0 


La solución de este sistema consta de un conjunto de valores x que simultáneamente hacen que todas 
las ecuaciones sean iguales a cero. 

En la parte tres, presentaremos los métodos, para el caso en que las ecuaciones simultáneas son 
lineales, es decir, que se puedan expresar en la forma general 


JO) =4/x,+ 0.) ++"+4,x,-b=0 (6.18) 


donde la b y las a son constantes. A las ecuaciones algebraicas y trascendentes que no se pueden 
expresar de esta forma se les llama ecuaciones no lineales. Por ejemplo, 


x*+xy=10 


y + 3xy?= 57 


son dos ecuaciones simultáneas no lineales con dos incógnitas, x y y, las cuales se expresan en la 
forma de la ecuación (6.17) como 


u(x, y) =x2+xy-10=0 (6.19a) 
ví(x, y) = y + 3xy?-57=0 (6.19b) 
Así, la solución serían los valores de x y de y que hacen a las funciones u(x, y) y v(x, y) iguales a 
cero. La mayoría de los métodos para determinar tales soluciones son extensiones de los métodos 


abiertos para resolver ecuaciones simples. En esta sección presentaremos dos de ellos: iteración de 
punto fijo y Newton-Raphson. 


6.6.1 Iteración de punto fijo 


El método de iteración de punto fijo (sección 6.1) puede modificarse para resolver dos ecuaciones 
simultáneas no lineales. Este método se ilustra en el siguiente ejemplo. 


EJEMPLO 6.11  Iteración de punto fijo para un sistema no lineal 


Planteamiento del problema Con el método de iteración de punto fijo determine las raíces de 
la ecuación (6.19). Observe que un par correcto de raíces es x=2 y y = 3. Inicie el cálculo con el 
valor inicial x= 1.5 y y = 3.5. 


Solución De la ecuación (6.194) se puede despejar 


10- E 
Y; 
y de la ecuación (6.19b) se puede despejar 


Xy 1 (E6.11.1) 


Yi+1=57 — 3x9? (E6.11.2) 
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Observe que dejaremos los subíndices en el resto del ejemplo. 
Con base en los valores iniciales, la ecuación (E6.11.1) se utiliza para determinar un nuevo 
valor de x: 


2, 
yz OSO 05400 


Este resultado y el valor inicial de y = 3.5 se sustituye en la ecuación (E6.11.2) para determinar un 
nuevo valor de y: 


y = 57 - 3(2.21429)13.5)? = -24,37516 


Así, parece que el método diverge. Este comportamiento es aún más pronunciado en la segunda 
iteración: 
_ 10-(2.21429) 
-24.37516 


= -0.20910 


y = 57 — 3(-0.20910)(24.37516)? = 429.709 


En efecto, la aproximación se está descomponiendo. 
Ahora repita el cálculo, pero con la ecuación original puesta en una forma diferente. Por ejem- 
plo, un despeje alternativo de la ecuación (6.19a) es 


x=/10-xy 


y de la ecuación (6.19b) es 


Ahora los resultados son más satisfactorios: 


x=/10-1.53.5) =2.17945 


y= ASIA a 2.86051 
3(2.17945) 


x =,/10-2.17945(2.86051) =1.94053 


E 57-2.86051 -3.04955 
3(1.94053) 


Así, la aproximación converge hacia la solución correcta x=2 y y = 3. 


El ejemplo anterior ilustra la más seria desventaja de la iteración simple de punto fijo, ésta es 
que, la convergencia depende de la manera en que se formula la ecuación. Además, aun cuando la 
convergencia es posible, la divergencia puede ocurrir si los valores iniciales no son suficientemente 
cercanos a la solución verdadera. Usando un razonamiento similar al del cuadro 6.1, se demuestra 
que las condiciones suficientes para la convergencia en el caso de dos ecuaciones son 


du 


Ox 


du 


dy 


+ < 1 


6.6 Sistemas de ecuaciones no lineales 


du 
Ox 


dv 


+ |—— 
dy 


Estos criterios son tan restringidos que el método de punto fijo tiene una utilidad limitada para re- 
solver sistemas no lineales. Sin embargo, como se describirá más adelante en el libro, será muy útil 
para resolver sistemas de ecuaciones lineales. 


6.6.2 MNewton-Raphson 


Recuerde que el método de Newton-Raphson se utilizó empleando la derivada (al evaluar, es la 
pendiente de la recta tangente) de una función, para calcular su intersección con el eje de la variable 
independiente; esto es, la raíz (figura 6.5). Dicho cálculo se basó en la expansión de la serie de Taylor 
de primer orden (recuerde el cuadro 6.2), 


Aoi) = AR) + 11) Fx) (6.20) 


donde x, es el valor inicial de la raíz y x,, , es el valor en el cual la recta tangente interseca el eje x. 
En esta intersección, f(x; ,) es, por definición, igual a cero y la ecuación (6.20) se reordena para 
tener 


a Fo) 
f “(x;) 


(6.21) 


Xi+1 2 Xi 


que es la forma del método de Newton-Raphson para una sola ecuación. 

La forma para múltiples ecuaciones se obtiene en forma idéntica. Sin embargo, se debe usar una 
serie de Taylor de múltiples variables para tomar en cuenta el hecho de que más de una variable 
independiente contribuye a la determinación de la raíz. En el caso de dos variables, una serie de 
Taylor de primer orden se escribe [recuerde la ecuación (4.26)] para cada ecuación no lineal como 


du, du, 
Ujy 1 = UR (¡4 1 — M5) + Oí+1— Ji) (6.22a) 
Ox dy 
y 
0v, 0v, 
O 1= 04 (1 XA) 37 + O 1 Y) 2 (6.22b) 
Ox dy : 
De la misma manera como en la versión para una sola ecuación, la raíz aproximada corresponde a 
los valores de x y y, donde u;, ¡ y v;, Son iguales a cero. En tal situación, se reordena la ecuación 


(6.22) como: 


du, du, du, du, 

E E (6.23a) 
Ox i+1 dy dirt i i Ox Ne dy 
0v, 0v, 0v, 0v, 

E O A A A E A A 6.23b 
dx i+1 dy Yist i i dx Y; dy ( ) 


Debido a que se conocen todos los valores con subíndice ¡ (corresponden al último valor estimado), 
las únicas incógnitas son x;, ¡ y y;, ¡- Entonces, la ecuación (6.23) es un conjunto de dos ecuaciones 
lineales con dos incógnitas [compare con la ecuación (6.18)]. En consecuencia, se pueden usar ma- 
nipulaciones algebraicas (por ejemplo, la regla de Cramer) para resolverlo: 


E 
a “dy “Oy 
Ma de, Om, du ai 
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4 du, , dv, 
E dx “ox 
Vivi Yi du, dv, du, de, (6.24b) 
dx dy dy Ox 


El denominador de cada una de esas ecuaciones se conoce formalmente como el determinante ja- 
cobiano del sistema. 

La ecuación (6.24) es la versión para dos ecuaciones del método de Newton-Raphson. Como en 
el siguiente ejemplo, se puede emplear en forma iterativa para determinar las raíces de dos ecuacio- 
nes simultáneas. 


EJEMPLO 6.12 Newton-Raphson para un sistema no lineal 
Planteamiento del problema Con el método de Newton-Raphson para múltiples ecuaciones 
determine las raíces de la ecuación (6.19). Observe que un par correcto de raíces es x=2 y y = 3. 


Use como valores iniciales x= 1.5 y y = 3.5. 


Solución Primero calcule las derivadas parciales y evalúelas con los valores iniciales de x y y: 


du, du, 

— =2x+ y =2(1.5)+3.5=6.5 = =x=1.5 

DS (1.5) y 

0v, 2 2 dv) _ e _— 
=3y" =3(3.5)' = 36.75 —"=1+6xy =1+ 60.5(3.5) = 32.5 

Ox dy 


Así, el determinante jacobiano para la primera iteración es 
6.532.5) —- 1.5(36.75) = 156.125 

Los valores de las funciones se evalúan con los valores iniciales como 
UU) = (1.5 + 1.5(3.5) - 10=-2,5 
Y =3.5 + 3(1.518.5 - 57 = 1.625 

Estos valores se sustituyen en la ecuación (6.24): 


-2.5(32.5) -1.625(1.5) 
156.125 


a le] = 2.03603 


1.625(6.5) — (-2.5)(36.75) 
156.125 


=3.5 = 2.84388 


Así, los resultados están convergiendo a los valores verdaderos x =2 y y =3. Los cálculos se repiten 
hasta que se obtenga una precisión aceptable. 


Como con el método de iteración de punto fijo, la aproximación de Newton-Raphson puede 
diverger si los valores iniciales no están lo suficientemente cercanos a la raíz verdadera. Mientras 
que para el caso de una sola ecuación los métodos gráficos son útiles para obtener un buen valor 
inicial, ningún procedimiento tan simple está disponible para el caso de múltiples ecuaciones. Aun- 
que existen algunos métodos avanzados para obtener una primera aproximación aceptable, los va- 
lores iniciales a menudo deben obtenerse mediante prueba y error, con el conocimiento del sistema 
físico que se está modelando. 

El método de Newton-Raphson para dos ecuaciones puede generalizarse para resolver n ecua- 
ciones simultáneas. Debido a que el camino más eficiente para esto implica el álgebra matricial y la 
solución de ecuaciones lineales simultáneas, se pospondrá su estudio para la parte tres. 


PROBLEMAS 


6.1 Utilice la iteración simple de punto fijo para localizar la raíz de 


Fo) = sen(y/x)-x 


Haga una elección inicial de x, = 0.5 e ¡tere hasta que e, € 0.01%. 
Compruebe que el proceso converge en forma lineal según se des- 
cribió en el cuadro 6.1. 

6.2 Determine la raíz real más grande de 


fo) = 2 - 11.712 + 17.7x-5 


a) En forma gráfica. 

b) Con el método de iteración simple de punto fijo (tres iteraciones, 
Xxo= 3). Nota: Asegúrese de haber desarrollado una solución que 
converja a la raíz. 

c) Con el método de Newton-Raphson (tres iteraciones, xy = 3). 

d) Con el método de la secante (tres iteraciones x_¡ = 3, xp = 4). 

e) Con.el método de la secante modificado (tres iteraciones, xy = 3, 
0 = 0.01). Calcule el porcentaje aproximado de errores relativos 
para sus soluciones. 

6.3 Utilice los métodos de a) iteración de punto fijo y b) Newton- 
Raphson, para determinar una raíz de f(x) = -0.9x? + 1.7x + 2.5 con 
el uso de x, = 5. Haga el cálculo hasta que e,, sea menor que e, = 0.01%. 
Asimismo, realice una comprobación del error de su respuesta final. 
6.4 Determine las raíces reales de f(x) = —1 + 5.5x — 4x? + 0.5x*: a) 
en forma gráfica y b) con el método de Newton-Raphson dentro de 
e, = 0.01%. 

6.5 Emplee el método de Newton-Raphson para determinar una 
raíz real de f(x) =-1 + 5.5x — 4x? + 0.547 con el uso de valores ini- 
ciales de a) 4.52 y b) 4.54. Estudie y use métodos gráficos y analíticos 
para explicar cualquier peculiaridad en sus resultados. 

6.6 Determine la raíz real más pequeña de f(x) = -12 — 21x + 181? 
— 2.417: a) en forma gráfica y b) con el empleo del método de la se- 
cante para un valor de e, que corresponda a tres cifras significativas. 
6.7 Localice la primera raíz positiva de 


JO) = sen x + cos(1 + x?)- 1 


donde x está en radianes. Para localizar la raíz, use cuatro iteraciones 

del método de la secante con valores iniciales de a) x,_¡=1.0 y x; 

=3.03b)x,_¡=15yx,=2.5,0)x,_¡=1.5 y x,=2.25, d) use el 

método gráfico para explicar su resultado. 

6.8 Determine la raíz real de 17% = 80, con el método de la secante 

modificado dentro de e, = 0.1%, con el uso de una elección inicial 

de xy =3.5y0=0.01. 

6.9 Determine la raíz real más grande de f(x) = x?- 61? + 11x-6.1. 

a) En forma gráfica. 

b) Con el uso del método de Newton-Raphson (tres iteraciones, x; 
=3.5). 

c) Con el método de la secante (tres iteraciones, x;, ¡ =2.5 y x= 
3.5). 

d) Por medio del método de la secante modificado (tres iteraciones, 
x¡=3.5,0 =0.01). 

6.10 Determine la menor raíz positiva de f(x) = 7 sente” — 1: 

a) En forma gráfica. 

b) Con el uso del método de Newton-Raphson (tres iteraciones, x; 
=0.3). 

c) Con el método de la secante (cinco iteraciones, x,_,=0.5 y x,= 
0.4). 
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d) Por medio del método de la secante modificado (tres iteraciones 
x;=0.3, 0 = 0.01). 
6.11 Utilice el método de Newton-Raphson para encontrar la raíz de 


fa) =e 4 x)-2 


Utilice conjeturas iniciales de a) 2, b) 6 y c) 8. Explique sus resulta- 
dos. 
6.12 Dado que 


f()=-2x% - 1.5: +10x +2 


use una técnica de ubicación de raíces para determinar el máximo de 
esta función. Realice iteraciones hasta que el error relativo aproxi- 
mado caiga por debajo de 5%. Si emplea un método de agrupamien- 
to en regiones, use valores iniciales de x, = 0 y x, = 1. Si usted 
utiliza el método Newton-Raphson o el método modificado de la 
secante, use un valor inicial de x, = 1. Si se decide por el método de 
la secante, use valores iniciales de x,_, =0 y x,= 1. Suponiendo que 
no importa la convergencia, elija la técnica que sea más adecuada 
para este problema. Justifique su elección. 

6.13 Usted debe determinar la raíz de la siguiente función fácilmen- 
te diferenciable, 


ZE 


Elija la mejor técnica numérica, justifique su elección y luego use 
esa técnica para determinar la raíz. Observe que se sabe que, para 
valores iniciales positivos, todas las técnicas, salvo la iteración de 
punto fijo, finalmente convergen. Realice iteraciones hasta que el 
error relativo aproximado caiga por debajo de 2%. Si usted emplea 
un método cerrado, use valores iniciales de x,=0 y x, = 2. Si escoge 
el método de Newton-Raphson o el modificado de secante, use un 
valor inicial de x, = 0.7. Si se decide por el método de secante, use 
valores iniciales de x,_¡=0yx,=2. 

6.14 Use a) el método Newton-Raphson y b) el método de secante 
modificada ($ = 0.05) para determinar una raíz de Ax) =x7 — 16.05x* 
+ 88.75x?— 192.0375x? + 116.35x + 31.6875 usando un valor inicial 
de x= 0.5825 y e, = 0.01%. Explique sus resultados. 

6.15 El antiguo método de dividir y promediar, para obtener una 
apoximación de la raíz cuadrada de cualquier número positivo, a, se 
formula del modo siguiente: 


x+al/x 
x= 
2 


Demuestre que éste es equivalente al algoritmo de Newton-Raphson. 


6.16 a) Aplique el método de Newton-Raphson a la función f(x) = 
tanh(? — 9) para evaluar su raíz real conocida en x= 3. Use un valor 
inicial de xy = 3.2 y haga un mínimo de cuatro iteraciones. b) ¿Con- 
verge el método a su raíz real? Bosqueje la gráfica con los resultados 
para cada iteración que obtenga. 

6.17 El polinomio Ax) = 0.0074x* — 0.284x* + 3.3551? — 12.183x + 
5 tiene una raíz real entre 15 y 20. Aplique el método de Newton- 
Raphson a dicha función con valor inicial xy = 16.15. Explique sus 
resultados. 

6.18 Emplee el método de la secante con la función del círculo (x + 
1)? + (y - 2) = 16, a fin de encontrar una raíz real positiva. Haga que 
el valor inicial sea x,=3 y x,_¡ =0.5. Aproxímese a la solución del 
primer y cuarto cuadrantes. Cuando resuelva para f(x) en el cuarto 
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cuadrante, asegúrese de tomar el valor negativo de la raíz cuadrada. 
¿Por qué diverge la solución? 

6.19 Suponga el lector que está diseñando un tanque esférico (véase 
la figura P6.19) de almacenamiento de agua para un poblado peque- 
ño de un país en desarrollo. El volumen del líquido que puede con- 
tener se calcula con 


Io Ei 
3 


V 


donde V = volumen [m*], /4 = profundidad del agua en el tanque [m] 
y R = radio del tanque [ml]. 

Si R=3 m, ¿a qué profundidad debe llenarse el tanque de modo 
que contenga 30 m?? Haga tres iteraciones del método de Newton- 
Raphson para determinar la respuesta. Encuentre el error relativo 
aproximado después de cada iteración. Observe que el valor inicial 
de R convergerá siempre. 


Figura P6.19 


6.20 La ecuación de Manning se puede escribir para un flujo en un 
canal abierto rectangular como 


VS(BHY/ 
0= n(B+2Hy/3 
donde O = flujo [m/s], S= pendiente [m/m], A = profundidad [m] 
y n = coeficiente de rugosidad de Manning. Desarrolle un esque- 
ma de iteración para despejar H de esta ecuación dado O =5, S= 
0.0002, B =20 y n= 0.03. Pruebe que su esquema converge para 
todos los valores iniciales mayores que cero o iguales a cero. 
6.21 La función x* — 21? — 4x + 8 tiene una raíz doble en x= 2. Em- 
plee a) el método estándar de Newton-Raphson [ecuación (6.6)], b) 
el método de Newton-Raphson modificado [ecuación (6.12)] y c) el 
método de Newton-Raphson modificado [ecuación (6.16)] para re- 
solver para la raíz en x = 2. Compare y analice la velocidad de con- 
vergencia con un valor inicial x, = 1.2. 
6.22 Determine las raíces de las siguientes ecuaciones no lineales 
simultáneas, por medio de los métodos de a) iteración de punto fijo 
y b) Newton-Raphson: 


y=-2+x+0.75 


y+5xy =P 


Utilice valores iniciales de x = y = 1.2, y analice los resultados. 
6.23 Encuentre las raíces de las ecuaciones simultáneas que siguen: 
(-4P +47 =5 


*+y=16 


Use un enfoque gráfico para obtener los valores iniciales. Encuentre 
estimaciones refinadas con el método de Newton-Raphson para dos 
ecuaciones, que se describe en la sección 6.6.2. 

6.24 Repita el problema 6.23, pero ahora determinando la raíz posi- 
tiva de 


y=x+1 
y=2c08x 


6.25 El balance de masa de un contaminante en un lago bien mez- 
clado se expresa así: 
dc 


vÉE =w-0c-vxJc 
dt 


Dados los valores de parámetros V=1 x 10% m?, O =1x 10" m3/año, 
W=1x 10% g/año y k=0.25 m%/g%3/año, use el método de la secan- 
te modificado para resolver para la concentración de estado estable. 
Emplee un valor inicial c=4 g/m? y Ó = 0.5. Realice tres iteraciones 
y determine el error relativo porcentual después de la tercera iteración. 


6.26 Para el problema 6.25, la raíz puede localizarse con iteración 
de punto fijo como 


Cc= 
k 


o bien como 


e W-KVye 
Q 


De las que sólo una convergerá para valores iniciales de 2 < c < 6. 
Seleccione la correcta y demuestre por qué siempre lo será. 


6.27 Desarrolle un programa amigable para el usuario para el mé- 
todo de Newton-Raphson, con base en la figura 6.4 y la sección 
6.2.3. Pruébelo por medio de repetir el cálculo del ejemplo 6.3. 
6.28 Desarrolle un programa amigable para el usuario para el méto- 
do de la secante, con base en la figura 6.4 y la sección 6.3.2. Pruébe- 
lo con la repetición de los cálculos del ejemplo 6.6. 

6.29 Haga un programa amigable para el usuario para el método de 
la secante modificado, con base en la figura 6.4 y la sección 6.3.2. 
Pruébelo con la repetición del cálculo del ejemplo 6.8. 

6.30 Desarrolle un programa fácil para el usuario del método de 
Brent para la ubicación de raíces, basado en la figura 6.12. Pruébelo 
resolviendo el problema 6.6. 

6.31 Desarrolle un programa amigable para el usuario para el méto- 
do de Newton-Raphson para dos ecuaciones, con base en la sección 
6.6.2. Pruébelo con la solución del ejemplo 6.12. 

6.32 Use el programa que desarrolló en el problema 6.31 para resol- 
ver los problemas 6.22 y 6.23, con una tolerancia de e, = 0.01%. 


Raíces de polinomios 


En este capítulo estudiaremos los métodos para encontrar las raíces de ecuaciones polinomiales de 
la forma general 


f (00) =4a)+ayx+ ax + +a,x (1) 


donde n es el grado del polinomio y las a son los coeficientes constantes. Aunque los coeficientes 
pueden ser números complejos, se limitará la discusión a los casos en que son reales. Para tales casos, 
las raíces del polinomio pueden ser reales y/o complejas. 

Las raíces de los polinomios cumplen estas reglas: 


1. En una ecuación de grado n, hay n raíces reales o complejas. Se debe notar que esas raíces no 
necesariamente son distintas. 

2. Si nes impar, hay al menos una raíz real. 

3. Si existen raíces complejas, éstas se encuentran por pares conjugados (es decir, A + ui y A — ul), 


donde ¡= alot. 


Antes de describir las técnicas para localizar las raíces de polinomios, se proporcionarán algu- 
nos antecedentes. La primera sección da una motivación para estudiar dichas técnicas; la segunda 
trata de algunas manipulaciones computacionales fundamentales con polinomios. 


7.1 POLINOMIOS EN LA CIENCIA Y EN LA INGENIERÍA 


Los polinomios tienen muchas aplicaciones en la ciencia y en la ingeniería. Por ejemplo, se usan 
mucho en el ajuste de curvas. Aunque se considera que una de las aplicaciones más interesantes 
y potentes es la caracterización de sistemas dinámicos y, en particular, de sistemas lineales. Al- 
gunos ejemplos son los dispositivos mecánicos, las estructuras y los circuitos eléctricos. Se ana- 
lizarán ejemplos específicos en el resto del texto. Éstos, en particular, se enfocarán a varias 
aplicaciones en la ingeniería. 

Por ahora se mantendrá una discusión simple y general estudiando un sistema físico de segundo 
grado modelado con la siguiente ecuación diferencial ordinaria (EDO) lineal: 


2 
d 
ta, Sp FM = FO) (72) 


a, 


donde y y £ son las variables dependiente e independiente, respectivamente, las a son coeficientes 
constantes y F(t) es la función de fuerza (término no homogéneo). 

Además, se debe observar que la ecuación (7.2) puede expresarse en forma alternativa transfor- 
mándola en un par de EDO de primer grado, mediante la definición de una nueva variable z, 


d 
¿0 
dt 


La ecuación (7.3) se sustituye con su derivada en la ecuación (7.2) para eliminar el término de la 
segunda derivada. Esto reduce el problema a resolver 


(7.3) 


dz _ F()-a,z-apy 
dt a, 


(7.4) 


—=2 (7.5) 
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En forma similar, una EDO lineal de grado n-ésimo siempre puede transformarse en un sistema de 
n EDO de primer grado. 

Ahora veamos la solución. La función de fuerza representa el efecto del mundo exterior sobre 
el sistema. La solución general de la ecuación homogénea trata el caso donde la función de fuerza 
es igual a cero, 


2 
d 
ai +0, 7 +a)y=0 (7.6) 


a, 


Entonces, como su nombre lo indica, la solución general describe algo muy general acerca del sis- 
tema que está simulando; es decir, cómo responde el sistema en ausencia de un estímulo externo. 

Ahora bien, como la solución general de todos los sistemas lineales no forzados es de la forma 
y = e”. Si esta función se deriva y se sustituye en la ecuación (7.6), el resultado es 


are" + are" + aye" =0 
cancelando los términos exponenciales, 
ar? + ar + dy= 0 (17.7) 


Observe que el resultado es un polinomio llamado ecuación característica. Las raíces de este 
polinomio son los valores de r que satisfacen la ecuación (7.7). Las r se conocen como los valores 
característicos, o eigenvalores, del sistema. 

Se tiene aquí la relación entre las raíces de polinomios con la ciencia y la ingeniería. Los eigen- 
valores nos dicen algo fundamental acerca del sistema que se está modelando, así encontrar los ei- 
genvalores implica encontrar las raíces de los polinomios. Y mientras encontrar las raíces de una 
ecuación de segundo grado es fácil con la fórmula cuadrática, encontrar las raíces de sistemas de 
grado superior (y, por lo tanto, de un polinomio de grado superior) es arduo desde el punto de vista 
analítico. Entonces, se requiere usar métodos numéricos del tipo descrito en este capítulo. 

Antes de proceder con dichos métodos, investigaremos más profundamente qué valores espe- 
cíficos de los eigenvalores están implicados en el comportamiento de sistemas físicos. Primero se 
evaluarán las raíces de la ecuación (7.7) con la fórmula cuadrática 


2 
ñ  —a Exa; —4a,a, 


P do 


Se obtienen dos raíces. Si el discriminante (a? — 4a,4,) es positivo, las raíces son reales y la solución 
general se representa como 


y=cjen+c)e? (7.8) 


donde las c son constantes que se determinan a partir de las condiciones iniciales. Este caso se llama 
sobreamortiguado. 
Si el discriminante es cero, resulta una sola raíz real y la solución general se escribe como 


y = (c, + catje* (7.9) 


Este caso se llama con amortiguamiento crítico. 
Si el discriminante es negativo, las raíces son números complejos conjugados 


UN ; 
=4+pui 
P 


y la solución general se formula como 


y= ce ttm + cet ud 


7.2 Cálculos con polinomios 


El comportamiento fisico de esta solución se aclara mediante la 
fórmula de Euler 


etíl = cos ut + i sen ut 
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para reformular la solución general como (véase Boyce y DiPri- 
ma, 1992, para detalles de la demostración) 


y =c,e*' cos ut + c,e* sen ut (7.10) 


Este caso se llama subamortiguado. 

Las ecuaciones (7.8), (7.9) y (7.10) expresan las maneras 
posibles en que los sistemas lineales responden dinámicamente. 
El término exponencial indica que la solución del sistema es capaz 
de decaer (parte real negativa) o crecer (parte real positiva) expo- 
nencialmente con el tiempo (figura 7.1a). El término senosoidal 
(parte imaginaria) significa que la solución puede oscilar (figura 
7.1b). Si el eigenvalor tiene tanto parte real como imaginaria, se c) 
combinan la forma exponencial y senosoidal (figura 7.1c). Debi- 
do a que este conocimiento es el elemento clave para entender, 


Figura 7.1 


> 


b) 


diseñar y controlar el comportamiento de sistemas físicos, los La solución general de las EDO lineales puede estar deter- 


polinomios característicos son muy importantes en ingeniería Y  minada por componentes a) exponenciales y b) senosoi- 
en muchas ramas de la ciencia. Se analizará la dinámica de varios dales. La combinación de las dos formas es una senosoidal 


sistemas de ingeniería en las aplicaciones que se estudian en el amortiguada como se muestra en C). 


capítulo 8. 


7.2 CÁLCULOS CON POLINOMIOS 


Antes de describir los métodos para localizar raíces, se examinarán algunas operaciones fundamen- 
tales con polinomios. Dichas operaciones tendrán utilidad en sí mismas, además de proporcionar 
apoyo para localizar las raíces. 


7.2.1 Evaluación y derivación de polinomios 


Aunque la forma de la ecuación (7.1) es la más común, no resulta la mejor para determinar el valor 
de un polinomio para un valor específico de x. Por ejemplo, evaluar el polinomio de tercer grado 
como 


A) =a3 + a? +ajx+ a (7.11) 


implica seis multiplicaciones y tres sumas. En general, para un polinomio de n-ésimo grado, se re- 
quieren n(n + 1)/2 multiplicaciones y n sumas. 
La forma anidada, en cambio 


AQ) = ((azx + ax + a1)x + ap (7.12) 


implica tres multiplicaciones y tres sumas. Para un polinomio de n-ésimo grado, esta forma requie- 
re n multiplicaciones y n sumas. Ya que la forma anidada minimiza el número de operaciones, 
también tiende a minimizar los errores de redondeo. Observe que, según sea la preferencia, el orden 
de anidamiento puede invertirse: 


(0 = ay + x(a, + x(a, + xa3)) (7.13) 


Un pseudocódigo adecuado para implementar la forma anidada se escribe simplemente como 


DOFOR j¡= n, 0, -1 
p=p*x+w* a(j) 
END DO 


donde p tiene el valor del polinomio (definido por los coeficientes de las a) evaluado en x. 
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Existen casos (como el método de Newton-Raphson) donde se requiere evaluar tanto la función 
como su derivada. Esta evaluación se puede también incluir al agregar una línea en el pseudocó- 
digo anterior, 


DOFOR j= n, 0, -1 
E a A SR a 


p=p*x+waíj) 
END DO 


donde df es la primera derivada del polinomio. 


7.2.2 Deflación polinomial 


Suponga que se determina una raíz de un polinomio de n-ésimo grado. Si se repite el procedimiento 
para localizar una raíz, puede encontrarse la misma raíz. Por lo tanto, sería adecuado eliminar la raíz 
encontrada antes de continuar. A este proceso de eliminar la raíz se le llama deflación polinomial. 

Antes de mostrar cómo se hace esto, veamos algunos antecedentes útiles. Los polinomios son 
típicamente representados en la forma de la ecuación (7.1). Por ejemplo, un polinomio de quinto 
grado puede escribirse como 


fa) =-120 — 46x + 791? — 349 — Ta? + 10 (7.14) 


Aunque ésta es la forma más común, no necesariamente es la mejor expresión para entender el com- 
portamiento matemático de los polinomios. Por ejemplo, este polinomio de quinto grado se expresa 
de manera alternativa como 


$500 = (a+ 1) — 4) — Six + 3)(x — 2) (7.15) 


Ésta se conoce como la forma factorizada de un polinomio. Si se efectúa la multiplicación y se 
agrupan los términos semejantes, se obtendrá la ecuación (7.14). Sin embargo, la forma de la ecuación 
(7.15) tiene la ventaja de que indica claramente las raíces de la función. Así, resulta claro que x =-1, 
4, 5, 3 y 2 son todas las raíces, porque cada una hace que uno de los términos de la ecuación (7.15) 
sea igual a cero. 

Ahora, suponga que se divide este polinomio de quinto grado entre cualquiera de sus factores; por 
ejemplo, x + 3. En este caso, el resultado será un polinomio de cuarto grado 


Fa) = (e + 1) 4) — SM — 2) = 40 — 2x + 271? 1017 + x* (7.16) 


con un residuo igual a cero. 

En el pasado, quizás usted aprendió que los polinomios se dividen usando un procedimiento 
llamado división sintética. Varios algoritmos de computadora (basados tanto en la división sintética 
como en otros métodos) están disponibles para realizar la operación. Un esquema simple se propor- 
ciona en el siguiente pseudocódigo, el cual divide un polinomio de n-ésimo grado entre un factor 
monomial x — £. 


r= a(n) 
aín)= 0 


DOFOR 1 


ndo Ol. =1 


a(i) = r 
r=s+rv*t 
END DO 


Si el monomio es una raíz del polinomio, el residuo r será cero, y los coeficientes del cociente se 
guardarán en a, al final del ciclo. 


7.2 Cálculos con polinomios 


EJEMPLO 7.1 Deflación polinomial 


Planteamiento del problema  Divida el polinomio de segundo grado 
FOO) = (a 4) +6) =1?+2x 24 


entre el factor x — 4. 


141 


Solución Usando el método propuesto en el pseudocódigo anterior, los parámetros son n =2, ay 


= 24, a, =2,a,=1 y t=4. Estos valores se usan para calcular 
r=a,=1 
d,= 

El loop o ciclo se itera después desde ¡=2-—1= 1 hasta 0. Para i=1, 
s=a=2 


aj=r=1 
r=s+rt=24+1(4)=6 


Para ¡=0, 
s=a7=-24 
a)=r=6 


r=-24+6(4)=0 


Así, el resultado, como se esperaba, es el cociente a, + ax = 6 + x, con un residuo de cero. 


También es posible dividir entre polinomios de grado superior. Como 
se verá más adelante en este capítulo, la tarea más común es dividir entre un 
polinomio de segundo grado o parábola. La subrutina de la figura 7.2 resuel- 
ve el problema más general de dividir un polinomio a de grado n entre un 
polinomio d de grado m. El resultado es un polinomio q de grado (n — m), 
con un polinomio de grado (m — 1) como el residuo. 

Ya que cada raíz calculada se conoce únicamente en forma aproxima- 
da, se observa que la deflación es sensible al error de redondeo. En algunos 
casos puede crecer a tal punto que los resultados lleguen a no tener sentido. 

Algunas estrategias generales pueden aplicarse para minimizar el pro- 
blema. Por ejemplo, el error de redondeo está afectado por el orden en que 
se evalúan los términos. La deflación hacia adelante se refiere al caso don- 
de los coeficientes del nuevo polinomio están en grado de potencias descen- 
dentes de x (es decir, del término de mayor grado al de grado cero). En tal 
caso, es preferible dividir primero entre las raíces con el valor absoluto más 
pequeño. En forma inversa, en la deflación hacia atrás (esto es, del término 
de grado cero al de mayor grado) es preferible dividir primero entre las 
raíces con mayor valor absoluto. 

Otra manera de reducir los errores de redondeo es considerar que cada 
raíz sucesiva estimada, obtenida durante la deflación es un buen primer 
valor inicial. Al utilizarse como un valor inicial, y determinar las raíces otra 
vez con el polinomio original sin deflación, se obtienen raíces que se cono- 
cen como raíces pulidas. 

Por último, se presenta un problema cuando dos raíces deflacionadas 
son suficientemente inexactas, de tal manera que ambas convergen a la 


SUB poldiví(a, n, d, m, q, r) 
DOFOR j= 0, n 


r(j) = a(j) 
q(J)= 0 
END DO 


DOFOR k = n-m, 0, -1 
q(k+1) = rím+k) / d(m) 
DOFOR j = m+k-1, k, -1 
r(3) = r(j)-q(k*1) * b(j-k) 
END DO 


END DO 

DOFOR j = m, n 
r(j)=0 

END DO 

n= n-m 


DOFOR ¡=0, n 
a(i) = q(i+1) 

END DO 

END SUB 


Figura 7.2 

Algoritmo que divide un polinomio (definido por 
sus coeficientes a) entre un polinomio de grado 
menor dl. 


misma raíz no deflacionada. En tal caso, se podría creer en forma errónea que un polinomio tiene 
una raíz múltiple (recuerde la sección 6.5). Una forma para detectar este problema consiste en com- 
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parar cada raíz pulida con las que se han calculado anteriormente. Press et al. (2007) analizan el 
problema con mayor detalle. 


7.3 MÉTODOS CONVENCIONALES 


Ahora que se ha visto algún material de apoyo sobre polinomios, empezaremos a describir los mé- 
todos para localizar sus raíces. Es obvio que el primer paso sería investigar la posibilidad de usar los 
métodos cerrados y abiertos, descritos en los capítulos 5 y 6. 

La eficacia de dichos métodos depende de que el problema a resolver tenga raíces complejas. 
Si sólo existen raíces reales, cualquiera de los métodos descritos anteriormente puede utilizarse. 
Sin embargo, el problema de encontrar un buen valor inicial complica tanto los métodos cerrados 
como los abiertos; además que los métodos abiertos podrían ser susceptibles a problemas de di- 
vergencia. 

Cuando existen raíces complejas, los métodos cerrados obviamente no se pueden usar, ya que el 
criterio para definir el intervalo (que es el cambio de signo) no puede trasladarse a valores complejos. 

De los métodos abiertos, el método convencional de Newton-Raphson llega a ofrecer una aproxi- 
mación viable. En particular, es posible desarrollar un código conciso que comprenda deflación. Si 
se usa un lenguaje que permite manipular variables complejas (como Fortran), entonces el algoritmo 
localizará tanto raíces reales como complejas. Sin embargo, como es de esperarse, podría ser sus- 
ceptible a tener problemas de convergencia. Por tal razón, se han desarrollado métodos especiales 
para encontrar raíces reales y complejas de polinomios. Se describen dos de estos métodos, el mé- 
todo de Miiller y el de Bairstow, en las siguientes secciones. Como se verá, ambos están relacionados 
con los métodos abiertos convencionales descritos en el capítulo 6. 


7.4 MÉTODO DE MÚLLER 


Recuerde que el método de la secante obtiene una aproximación de la raíz dirigiendo una línea 
recta hasta el eje x con dos valores de la función (figura 7.3a). El método de Miiller es similar; pero 
se construye una parábola con tres puntos (figura 7.3b). 

El método consiste en obtener los coeficientes de la parábola que pasa por los tres puntos. Dichos 
coeficientes se sustituyen en la fórmula cuadrática para obtener el valor donde la parábola interseca 
al eje x; es decir, la raíz estimada. La aproximación se facilita al escribir la ecuación de la parábola 
en una forma conveniente, 


$) =ax—x)? + b(x—x>,) + Cc (7.17) 


Queremos que esta parábola pase por tres puntos [xp, fo), Lx, K0y] y Lx,, A]. Los coeficientes 
de la ecuación (7.17) se evalúan sustituyendo cada uno de esos tres puntos para dar 


HO) = ala) — 2)? + b(xp—x7) + € (7.18) 


Parábola 


Raíz 


a) 


A loo - 
xY 


o Figura 7.3 
Raíz Una comparación de dos métodos relacio- 
estimada nados para encontrar raíces: a) el método 
b) de la secante y b) el método de Muller. 


7.4 Método de Muller 


fo) =a(x, xx) + b(x,-x) +c (7.19) 
fo) = ax) —x) + b(x,-x) +c (7.20) 
Observe que se ha eliminado el subíndice “2” de la función por brevedad. Debido a que se tienen 
tres ecuaciones, es posible encontrar los tres coeficientes desconocidos a, b y c. Debido a que dos 
términos de la ecuación (7.20) son cero, se encuentra inmediatamente que c = f(x»). Así, el coefi- 


ciente c es igual al valor de la función evaluada en el tercer valor inicial, x,. Este resultado se susti- 
tuye en las ecuaciones (7.18) y (7.19) para tener dos ecuaciones con dos incógnitas: 


Ko) — Rx) = a(xo — x2)? + b(xo — x2) (7.21) 
Ax) Rx) = ala, —x2)? + b(x, —x2) (7.22) 


Una manipulación algebraica permite encontrar los coeficientes restantes a y b. La manera de 
hacer esto consiste en definir las diferencias: 


hy =X1—Xo hi =xX,=X1 
3, = LED 40) ¿FETO (7.23) 
X= Xo A 


Éstas se sustituyen en las ecuaciones (7.21 ) y (7.22) para dar 
(hy + hy)b — (hy + ha = hy) +10, 
h b= h a= h10 


de donde se despejan a y b. El resultado se resume como 


0, — 9, 
a = ————= (7.24) 
h, es ho 
b= ahi +0, (1.25) 
c=f(x,) (7.26) 


Para encontrar la raíz se aplica la fórmula cuadrática a la ecuación (7.17). Sin embargo, debido 
al error de redondeo potencial, en lugar de usar la forma convencional, se usará la fórmula alterna- 
tiva [ecuación (3.13)], es decir, 


2c 
X= X= (1.27a) 
a b+xb? —4ac 
o despejando la incógnita xx del lado izquierdo del signo igual, 
—2c 
X¿=x, + (7.27b) 


b+xWb?—4ac 


Observe que al usar la fórmula cuadrática, es posible localizar tanto las raíces reales como las com- 
plejas. Ésta es la mayor ventaja del método. 

Además, la ecuación (7.27a) proporciona una forma directa para determinar el error de aproxi- 
mación. Debido a que el lado izquierdo representa la diferencia entre la raíz estimada actual (x3) y 
la raíz estimada anterior (x,), el error se calcula como 


Ma 100% 


*3 


e = 


a 
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Ahora, un problema de la ecuación (7.27a) es que produce dos raíces, correspondientes a los 
términos + del denominador. En el método de Miiller, se escoge el signo que coincida con el signo 
de b. Esta elección proporciona como resultado el denominador más grande y, por lo tanto, dará la 
raíz estimada más cercana a x). 

Una vez que se determinó x3, el proceso se repite. Esto trae el problema de que un valor es des- 
cartado. En general, dos estrategias son comúnmente usadas: 


1. Si sólo se localizan raíces reales, elegimos los dos valores originales más cercanos a la nueva 
raíz estimada, x3. 

2. Sise localizan raíces reales y complejas, se emplea un método secuencial. Es decir, como en el 
método de la secante, x,, x, y x3 toman el lugar de xp, x, y X2. 


EJEMPLO 7.2 Método de Muller 


Planteamiento del problema Utilice el método de Miller con valores iniciales xp, x, y x, = 
4.5, 5.5 y 5, respectivamente, para determinar la raíz de la ecuación 


J0) =x*-13x- 12 

Observe que las raíces de la ecuación son -3, —1 y 4. 

Solución Primero se evaluará la función con los valores iniciales 
K4.5) = 20.625 AG.5) = 82.875 FO) = 48 


que se emplean para calcular 


E Sás2a h=5-5.5=-05 
2.875-20.62 48-82.87 
y ARTIC e O a 
55-45 5-55 


Estos valores, a su vez, se sustituyen con las ecuaciones (7.24) a (7.26) para calcular 


PA A E 
—0.5+1 


La raíz cuadrada del discriminante se evalúa como 
62.25? — 4(15)48 =31.54461 


Luego, como |62.25 + 31.54451] > |62.25 — 31.54451|, se emplea un signo positivo en el denominador 
de la ecuación (7.27b), y la nueva raíz estimada se determina como 


x,=5+ 200) = 3.976487 
ó 62.25+31.54451 


y desarrollando el error estimado 


E asa 
“13.976487 


Debido a que el error es grande, se asignan nuevos valores: x, se reemplaza por x,, x, se reemplaza 
por x, y x, se reemplaza por x3. Por lo tanto, para la nueva iteración, 


| 100% = 25.74% 


m=55  x1=5  x=3.976487 


y se repite el cálculo. Los resultados, tabulados a continuación, muestran que el método converge 
rápidamente a la raíz x,=4: 


7.5 Método de Bairstow 


¡ Xp €a (%) 

0 5 

1 3.976487 25.74 

2 4.00105 0.6139 

3 4 0.0262 

4 4 0.0000119 


El pseudocódigo del método de Miúiller para raíces reales se presenta en la figura 7.4. Observe 
que esta rutina toma un valor inicial único diferente de cero, que después se altera por el factor h 
para generar los otros dos valores iniciales. Por supuesto, el algoritmo puede programarse para 
considerarse tres valores iniciales. Con lenguajes parecidos a Fortran, el programa encontrará raíces 
complejas si las variables adecuadas se declaran como complejas. 


SUB Múller(xr, h, eps, maxit) 
Xo= Xp 
Xi = Xp + h*X, 
Xo= Xp - h*xX»o 

DO 

¡ter = ¡ter + 1 

Po = X1 - Xo 

Mr = Xo- X 

do = (F(x3) = F(x0)) / ho 
dy = (F(x2) -= F(x1)) / h; 
a= (di; = do) /(h, + ho) 
b= a*h; + d; 

c= f(x2) 

rad = SQRT(D*b - 4*a*c) 
IF |b+rad| > |b-rad| THEN 

den = b+ rad 
ELSE 
den = b - rad 

END IF 

dx, = -2*c /den 

Xp = X2 + dXp 

PRINT ¡ter, X, 

IF (|dx,| < eps*x, OR ¡ter >= maxit) EXIT 


Xo= X 
X1 = Xo Figura 7.4 
Xo= Xp Pseudocódigo para el método 
END DO de Muller. 
END Múller 


7.5 MÉTODO DE BAIRSTOW 


El método de Bairstow es un método iterativo relacionado de alguna manera con los métodos de 
Miller y de Newton-Raphson. Antes de hacer la descripción matemática de éste, recuerde la forma 
factorizada de un polinomio, por ejemplo 


Fs) = (+ DG — 4)0 — SM + 3) — 2) (7.28) 


Si se divide entre un factor que no es una raíz (por ejemplo, x + 6), el cociente es un polinomio de 
cuarto grado. Aunque, en este caso, habrá un residuo. 

Con estas consideraciones se puede elaborar un algoritmo para determinar la raíz de un polino- 
mio: 1) dé un valor inicial para la raíz x = t; 2) divida el polinomio entre el factor x — £, y 3) deter- 
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mine si hay un residuo diferente de cero. Si no, el valor inicial es perfecto y la raíz es igual a £. Si 
existe un residuo, se ajusta el valor inicial en forma sistemática y se repite el procedimiento hasta 
que el residuo desaparezca y se localice la raíz. Una vez hecho esto, se repite el procedimiento to- 
talmente, ahora con el cociente para localizar otra raíz. 

Por lo general, el método de Bairstow se basa en esta manera de proceder. Por consiguiente, 
depende del proceso matemático de dividir un polinomio entre un factor. Recuerde (sección 7.2.2) 
de nuestro estudio de la deflación de polinomios que la división sintética implica la división del 
polinomio entre un factor x — £. Por ejemplo, el polinomio general [ecuación (7.1)] 


$, (0) =4y+ 4x4 0,7 + +a,1 (7.29) 
se divide entre el factor x — £ para dar un segundo polinomio que es de un grado menor: 

f.-100)=bi+bax+bx2+- +byx"7! (7.30) 
con un residuo R = by, donde los coeficientes se calculan por la relación de recurrencia 


b, = 4, 


b;=4,+Db;, ¡1 parai=n-1a0 


Observe que si £ es una raíz del polinomio original, el residuo b, sería igual a cero. 

Para permitir la evaluación de raíces complejas, el método de Bairstow divide el polinomio 
entre un factor cuadrático x? — rx— s. Si esto se hace con la ecuación (7.29), el resultado es un nuevo 
polinomio 


4. 00)=ba+ bit +b, 0734 by xr? 
con un residuo 


Como con la división sintética normal, se utiliza una relación de recurrencia simple para realizar la 
división entre el factor cuadrático: 


b,=4, (1.32a) 
D,-1= 4,1 +1b, (7.32b) 
b;¡=4a¡+rb;,¡+8b;,> parai=n-2a0 (7.32c) 


El factor cuadrático se introduce para permitir la determinación de las raíces complejas. Esto 
se relaciona con el hecho de que, si los coeficientes del polinomio original son reales, las raíces 
complejas se presentan en pares conjugados. Si x? — rx — s es un divisor exacto del polinomio, las 
raíces complejas pueden determinarse con la fórmula cuadrática. Así, el método se reduce a deter- 
minar los valores de r y s que hacen que el factor cuadrático sea un divisor exacto. En otras palabras, 
se buscan los valores que hacen que el residuo sea igual a cero. 

La inspección de la ecuación (7.31) nos lleva a concluir que para que el residuo sea cero, by y by 
deben ser cero. Como es improbable que los valores iniciales para evaluar r y s conduzcan a este 
resultado, debemos determinar una forma sistemática para modificar los valores iniciales, de tal 
forma que b, y b, tiendan a cero. Para lograrlo, el método de Bairstow usa una estrategia similar a 
la del método de Newton-Raphson. Como tanto b¿ como b, son funciones de r y s, se pueden expan- 
dir usando una serie de Taylor, así [recuerde la ecuación (4.26)]: 


dbi(r+Ar, s + As)=b,+ OLar+ Zas 
s 
bar + Ar, s + As)=b,+ Or Ea (7.33) 
r s 


donde los valores del lado derecho se evalúan en r y s. Observe que se han despreciado los términos 
de segundo grado y de grado superior. Esto representa una suposición implícita de que —r y —s son 


7.5 Método de Bairstow 


suficientemente pequeños para que los términos de orden superior puedan despreciarse. Otra mane- 
ra de expresar esta suposición es que los valores iniciales son adecuadamente cercanos a los valores 
de r y s en las raíces. 

Los incrementos, Ar y As, necesarios para mejorar nuestros valores iniciales, se estiman igua- 
lando a cero la ecuación (7.33) para dar 


ob, ob 

Ar+ TL As=-b 7.34 

dr d Os d A Eo 

9 Ar+ oo As=-b, (7.35) 
r Os 


Si las derivadas parciales de las b pueden determinarse, hay un sistema de dos ecuaciones que se 
resuelve simultáneamente para las dos incógnitas, Ar y As. Bairstow demostró que las derivadas 
parciales se obtienen por división sintética de las b en forma similar a como las b mismas fueron 
obtenidas: 


c,=b,, (7.36a) 
Cn-1=Dbp-1 +YCp (7.36b) 
C=b¡+1C¡,1+8C;¡ 4) parai=n-2a1 (7.36c) 


donde dby/dr = c,, Oby/ds = db,/dr = c, y db,/ds = cz. Así, las derivadas parciales se obtienen por la 
división sintética de las b. Entonces, las derivadas parciales se sustituyen en las ecuaciones (7.34) y 
(7.35) junto con las b para dar 


c¿Ar + czAs =-—b; 
c¡Ar + CAS = —bo 
Estas ecuaciones se resuelven para Ar y As, las cuales, a su vez, se emplean para mejorar los valores 


iniciales de r y s. En cada paso, se estima un error aproximado en r y s: 


Ar 
le, = e 100% (7.37) 


As 
le] = | 100% (7.38) 
Ss 


Cuando ambos errores estimados caen por debajo de un criterio especificado de terminación e,, los 
valores de las raíces se determinan mediante 


rar? +45 
x= ——_—_——— 
2 
En este punto, existen tres posibilidades: 


(7.39) 


1. El cociente es un polinomio de tercer grado o mayor. En tal caso, el método de Bairstow se 
aplica al cociente para evaluar un nuevo valor de r y s. Los valores anteriores de r y s pueden 
servir como valores iniciales en esta aplicación. 

2. El cociente es cuadrático. Aquí es posible evaluar directamente las dos raíces restantes con la 
ecuación (7.39). 

3. El cociente es un polinomio de primer grado. En este caso, la raíz restante se evalúa simplemente 
como 


A (7.40) 
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EJEMPLO 7.3 Método de Bairstow 


Planteamiento del problema Emplee el método de Bairstow para determinar las raíces del 
polinomio 


$500) =x5- 3.51% + 2.7517 + 2,1251? — 3.875x + 1.25 


Utilice como valores iniciales r=s =-—1 e ¡tere hasta un nivel de e,= 1%. 


Solución Se aplican las ecuaciones (7.32) y (7.36) para calcular 


b;=1 bi=45  b3=6.25 b,=0.375 b,=-10.5 
b)= 11.375 
cs=1 c4=-5.5  c3=1075  c,=-4875 c¡=-16.375 


Así, las ecuaciones simultáneas para encontrar Ar y As son 
4.875Ar + 10.75As = 10.5 
-16.375Ar — 4.875As =-11.375 


al ser resueltas se encuentra que Ar = 0.3558 y As = 1.1381. Por lo tanto, nuestros valores iniciales se 
corrigen a 


r=-1 + 0.3558 = -0.6442 
s=-1+ 1.1381 =0.1381 


y se evalúa el error aproximado con las ecuaciones (7.37) y (7.38), 


0.3558 
0.6442 


1.1381 
0.1381 


le.) = | | 100% =55.23% le.) = | | 100% = 824.19 


A continuación, se repiten los cálculos usando los valores revisados para r y s. Aplicando las ecua- 
ciones (7.32) y (7.36) se obtiene 


b;=1 b,=-4.1442 b,=5.5578 b,=-2.0276 b,=-1.8013 
b,=2.1304 
cs=1 c4=-4.7884 e, = 8.7806 €, =-8.3454 e, =4.7874 


Por lo tanto, se debe resolver el sistema de ecuación 


-8.3454Ar + 8.7806As = 1.8013 
4.7874Ar — 8.3454As = -2.1304 


al tener la solución Ar = 0.1331 y As = 0.3316, ésta se utiliza para corregir la raíz estimada: 


r = -0.6442 + 0.1331 =-0.5111 le, | = 26.0% 
s = 0.1381 + 0.3316 = 0.4697 le.,..]=70.6% 
El cálculo continúa, resultando que después de cuatro iteraciones el método converge a los va- 


lores r=-—0.5 (le, ,]=0.063%) y s = 0.5 (le 0.040%). La ecuación (7.39) puede emplearse para 
evaluar las raíces: 


0.5 + (0.5) . 
qe 0.51 (0.5) AD LO 
2 
Entonces, se tiene que el cociente es la ecuación cúbica 


FG) =x*-4x?+5.25x- 2.5 


al E 


El método de Bairstow puede aplicarse a este polinomio usando los resultados del paso anterior, r = 
0.5 y s = 0.5, como valores iniciales. Cinco iteraciones dan las aproximaciones r=2 y s=-1.249, 
las cuales se usan para calcular 


24412? +4(-1.24 
a PASOS 0000 


Xx 


2 


Ahora, el cociente es un polinomio de primer grado que puede ser directamente evaluado me- 
diante la ecuación (7.40) para determinar la quinta raíz: 2. 


7.5 Método de Bairstow 


Observe que la esencia del método de Bairstow es la evaluación de las b y de las c por medio de 
las ecuaciones (7.32) y (7.36). Una de las ventajas principales de este método radica en la forma con- 
cisa en la cual tales fórmulas de recurrencia pueden programarse. 


a) Algoritmo de Bairstow 


SUB Bairstow (a,nn,es,rr,ss,maxit,re,im,¡er) 


DIMENSION b(nn), c(nn) 
r= rr; s= Ss; n= nn 
ler = 0; eal = 1; ea2 = 1 
DO 
IFn< 3 0R ¡ter 2 maxit EXIT 


iter= 0 
DO 

¡ter = ¡ter + 1 

b(n) = a(n) 

bín - 1) = aín- 1)+ r * b(n) 
cn) = b(n) 

cín -= 1) = bín- 1)+ r * c(n) 
DO i=n-2, 0, -1 


b(1)= a(1)+ r*+b(1+1)+s5%*b(1+2) 
¡AA EN Eo E E E e E E 


END DO 
det = c(2) * c(2)-Cc(3) *c(1) 
IF det + 0 THEN 
dr = (=b(1) * c(2) + b(0) * 
ds = (=b(0) * 02) + b(1) * 


IF rz0 THEN eal = ABS(dr/r) 
IF s%0 THEN ea2 = ABS(ds/s) 
EESE 
r=r 1 
s=s+1 
iter= 0 
END IF 


IF eal < es AND ea2< es OR ¡ter 
END DO 
CALL Quadroot(r,s,r1,i1,r2,12) 
re(n) = rl 
im(n) = 11 
reín - 1) = r2 
imín = 1) = 12 


n= n-2 
DO 1=0, mn 

a[1) = b(1+ 2) 
END DO 


c(3))/det 
c(1))/det 


* 100 
* 100 


2 maxitEXIT 


IF ¡ter < maxit THEN 
IF n= 2 THEN 
F -=a(1)/a(2) 
S -=a(0)/a(2) 
CALL Quadroot(r,s,rl1,1i1,r2,12) 
re(n) = rl 


Il 


Il 


im(n) = 11 
reín - 1) = r2 
imítn -= 1) = 12 
ELSE 
re(n) = -a(0)/a(1) 
im(n) = 0 
END IF 
ELSE 
ler= 1] 
END IF 


END Bairstow 


b) Algoritmo para raíces de una cuadrática 


SUB Quadroot(r,s,r1,11,r2,12) 
disc=r"%* 2+4*s 
IF disc > 0 THEN 
rl = (r+ SQRT(disc))/2 
r2= (r -= SQRT(disc))/2 


11=0 
12=0 
ELSE 
rl = r/2 
r2 = rl 
11 = SORT(ABS(disc))/2 
12 = -11 
END IF 


END QuadRoot 


Figura 7.5 
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a) Algoritmo para el método de Bairstow junto con b) un algo- 
ritmo para determinar las raíces de una ecuación cuadrática. 
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En la figura 7.5 se muestra el pseudocódigo que ejecuta el método de Bairstow. La parte prin- 
cipal de este algoritmo es el ciclo que evalúa las b y c. También observe que el pseudocódigo para 
resolver las ecuaciones simultáneas revisa para evitar la división entre cero. Si éste es el caso, los 
valores de r y s se alteran ligeramente y el procedimiento comienza de nuevo. Además, en el algo- 
ritmo hay un lugar donde el usuario puede definir el número máximo de iteraciones (MAXIT) y está 
diseñado para evitar una división entre cero cuando se calcula el error estimado. Finalmente, el al- 
goritmo requiere valores iniciales para r y s (rr y ss en el código). Si no se tiene conocimiento a 
priori de que existan las raíces, se tendrá un conjunto de ceros al llamar el programa. 


7.6 OTROS MÉTODOS 


Otros métodos están disponibles para localizar las raíces de los polinomios. El método de Jenkins- 
Traub es comúnmente usado en bibliotecas de software. Es, en cierta medida, complicado y un pun- 
to de partida aceptable para entenderlo se encuentra en Ralston y Rabinowitz (1978). 

El método de Laguerre, que aproxima las raíces reales y complejas, tiene una convergencia 
cúbica, se encuentra entre los mejores métodos. Un análisis completo se encuentra en Householder 
(1970). Además, Press et al. (1992) ofrecen un buen algoritmo para implementar este método. 


7.7 LOCALIZACIÓN DE RAÍCES CON PAQUETES DE SOFTWARE 


Los paquetes de software tienen gran capacidad para localizar raíces. En esta sección, se ofrece una 
muestra de los más útiles. 


7.7.1 Excel 


Una hoja de cálculo como Excel se utiliza para localizar la raíz mediante prueba y error. Por ejem- 
plo, si se quiere encontrar una raíz de 


FA) =x-cos x 


primero se introduce un valor de x en una celda. Después se destina otra celda para f(x) donde se 
obtendrá el valor de la función para la x de la primera celda. Se puede variar el valor de la celda en 
x hasta que la celda de f(x) se aproxime a cero. Este proceso se mejora usando la capacidad de gra- 
ficación de Excel para obtener un buen valor inicial (figura 7.6). 

Aunque Excel facilita el método de prueba y error, también posee dos herramientas estándar que 
sirven para la localización de raíces: Goal Seek (buscar objetivo) y Solver. Ambas son útiles para 
ajustar sistemáticamente los valores iniciales. Goal Seek se utiliza expresamente para llevar la ecua- 
ción a un valor (en este caso, cero) mediante la variación de un solo parámetro. 


valores para la gráfica: 


x 1169) 
0 
0.5 
4 
1.5 
2 


4 
-0.37758 
0.459698 
1.429263 
2.416147 


Figura 7.6 


valores para prueba y error: 


Una hoja de cálculo para determi- 


x f(x 
0.739085f  -3.2E-1 pl 


nar la raíz de f(x) = x-—cos x por 
prueba y error. La gráfica se usa 
para obtener un buen valor inicial. 


7.7 Localización de raíces con paquetes de software 151 


EJEMPLO 7.4 Use la herramienta Goal Seek (buscar objetivo) de Excel 
para localizar una raíz simple 


Planteamiento del problema Emplee “buscar objetivo” para determinar la raíz de la función 
trascendente 


f0)=x-cos x 


Solución Como en la figura 7.6, la clave para resolver una sola ecuación con Excel es crear una 
celda que tenga el valor de la función en cuestión y hacer, después, el valor dependiente de otra celda. 
Una vez hecho esto, de la barra de herramientas se selecciona el menú Data (datos), después, dentro 
de What-if-Analysis, se selecciona “Goal Seek”. Ahora aparece una ventana de diálogo pidiendo se 
especifique una celda para un valor al modificar otra celda. Por ejemplo, suponga que, como en la fi- 
gura 7.6, el valor propuesto se escribe en la celda A11 y la función resultante en la celda B11. La 
ventana de diálogo para Goal Seek será la de la derecha. 

Cuando se selecciona el botón de OK (aceptar) una ventana de mensaje presenta los resultados 
de la ventana de abajo. 

Las celdas de la hoja de cálculo se modificarán con los nuevos valores, como se muestra en la 
figura 7.6. 


Goal Seek e XK | Gual Seek Status 


Set cell: 811 2 Goal Seeking with Cell B11 
found a solution, 


To value: 10 
: ==, Target value; 0 
By changing cell: | $a$11 Se Current value: -3,1516E-11 


La herramienta Solver es más sofisticada que Goal Seek porque 1) puede variar simultáneamen- 
te varias celdas y 2) además de llevar la celda destino a un valor, éste puede minimizarse o maxi- 
mizarse. En el siguiente ejemplo se ilustra cómo se utiliza para resolver un sistema de ecuaciones no 
lineales. 


EJEMPLO 7.5 Uso de Solver de Excel para un sistema no lineal 


Planteamiento del problema En la sección 6.6 obtuvimos la solución del siguiente sistema de 
ecuaciones simultáneas: 


u(x, y) =x2+xy-10=0 


v(x, y) =y + 3xy?-57=0 


Observe que un par de raíces es x=2 y y = 3. Utilice Solver para 
determinar las raíces usando como valores iniciales x= 1 y y =3.5. 


Solución Como se muestra en la siguiente tabla, dos celdas (B1 


y B2) pueden crearse para los valores iniciales x y y. Los valores u (x y) 25.5 
de la función, u(x, y) y v(x, y), pueden entrar en otras celdas (B3 v(x, y) 16.75 
y B4). Como se observa, los valores iniciales dan como resultado 
1 de la funció lej 3 
va a e la función que son lejanos a cero made Udo 3108125 
espués, se crea otra celda que contenga un valor que refle- a 


je qué tan cercanas de cero están ambas funciones. Una forma de 
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hacerlo consiste en sumar los cuadrados de los valores de las funciones. Este resultado se introduce 
en la celda B6. Si ambas funciones son cero, esta función deberá también ser cero. Además, usando 
los cuadrados de las funciones se evita la posibilidad de que ambas funciones puedan tener el mismo 
valor diferente de cero, pero con signos contrarios. En tal caso, la celda de apoyo (B6) podría ser 
cero, aunque las raíces podrían ser incorrectas. 

Una vez que la hoja de cálculo ha sido creada, se elige la opción Solver de la tira de datos. 
Entonces, una ventana de diálogo se presentará en pantalla, pidiéndole la información pertinente. 
Las celdas solicitadas en la ventana de diálogo de Solver se llenarán como 


Parámetros de Solver 12 1x] 
Celda objetivo: | $B$6 == | 
Valor de la = 
celda objetivo: (* Máximo (” Mínimo (+ Valores de: o Cr 


— Cambiando celdas: 


| $B$1:5B$2 5] Estimar 


- Sujetas a las siguientes restricciones: Opciones 
2 Agregar 


Cambiar 
— Reestablecer 
PEZ todo 
Él] Eliminar 
Ayuda 


Cuando el botón de OK (aceptar) se 


Xx 2.00003 selecciona, se abrirá una ventana de 

y 2.999984 diálogo con un reporte de las opera- 

u(x, y) 0.000176 ciones efectuadas. En el presente 

v(x y) 0.000202 caso, Solver obtiene la solución co- 
rrecta: 


Suma de cuadrados| 719E-08l 
a 


Se debe observar que Solver puede fallar. Su éxito depende de 1) la condición del sistema de ecua- 
ciones y/o 2) la calidad de los valores iniciales. El resultado satisfactorio del ejemplo anterior no está 
garantizado. Á pesar de esto, se puede encontrar a Solver bastante útil para hacer de él una buena 
opción en la obtención rápida de raíces para un amplio rango de aplicaciones a la ingeniería. 


7.7.2 MATLAB 


Como se resume en la tabla 7.1, MATLAB es capaz de localizar raíces en ecuaciones algebraicas y 
trascendentes. Es excelente para manipular y localizar raíces en los polinomios. 

La función fzero está diseñada para localizar la raíz de una función. Una representación sim- 
plificada de su sintaxis es 


fzero (f, xy, opciones) 


Observe que usted puede necesitar instalar Solver, eligiendo entre las opciones de Excel, Office, Adiciones (Add-Ins), se- 
leccionar Excel Add-Ins de la casilla de tomar y descargar (Drop Down box) en la parte inferior del Menú de Opciones Excel 
(Excel Options), y haga clic en Ir (Go). Luego ponga paloma en la casilla Solver. Así debe quedar instalado el Solver, y debe 
aparecer en su tira de Datos el respectivo botón de acceso. 
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donde £f es la función que se va a analizar, x, es el valor inicial y opciones son los parámetros de 
optimización (éstos pueden cambiarse al usar la función optimset). Si no se anotan las opciones se 
emplean los valores por omisión. Observe que se pueden emplear uno o dos valores iniciales, asumien- 
do que la raíz está dentro del intervalo. El siguiente ejemplo ilustra cómo se usa la función fzero. 


Tabla 7.1 Funciones comunes de MATLAB relacionadas con la manipulación 
de polinomios y la localización de raíces. 


Función Descripción 

fzero Raíz de una sola función 

roots Encuentra raíces de polinomios 

poly Construye polinomios con raíces específicas 
polival Evalúa un polinomio 

polivalm Evalúa un polinomio con argumento matricial 
residue Expansión de la fracción-parcial (residuos) 
polyder Diferenciación polinomial 

conv Multiplicación de polinomios 

deconv División de polinomios 


EJEMPLO 7.6 Uso de MATLAB para localizar raíces 


Planteamiento del problema Utilice la función £zero de MATLAB para encontrar las raíces de 
fO)=xP*-1 


dentro del intervalo x, =0 y x,, = 4, obviamente se tiene dos raíces —1 y 1. Recuerde que para determinar 
la raíz positiva en el ejemplo 5.6 se usó el método de la falsa posición con valores iniciales 0 y 1.3. 


Solución Bajo las mismas condiciones iniciales del ejemplo 5.6, se usa MATLAB para determi- 
nar la raíz positiva 


>> x0=[0 1.31; 
>> x=fzero(f (x) x"10-1,x0) 


Xx = 
1 


De manera semejante, se emplean los valores iniciales —1.3 y O para determinar la raíz negativa 


>> x0=[-1.3 0]; 
>> x=fzero(f (x) x*10-1,x0) 


Xx = 
-1 


Se puede usar un valor único; resulta un caso interesante cuando se usa el valor inicial O 
>> x0=0; 

>> x=fzero(f (x) x"*10-1,x0) 

SE = 


-1 


Se tiene que para ese valor el algoritmo llevará a la raíz a su valor negativo. 
El uso de optimset se ilustra al mostrar en pantalla la forma en que las iteraciones conducen 
a la solución 


>> x0=0; 
>> option=optimset ('DISP','“ITER'); 
>> x=fzero(t (x) x”10-1,x0,option) 
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Func-count x f(x) Procedure 
BR 0 -1 initial 
2 -0.0282843 =1 search 
3 0.0282843 =1 search 
4 -0.04 =L search 
21 0.64 -0.988471 search 
22 -0.905097 -0.631065 search 
23 0.905097 -0.631065 search 
24 =M::2:8 10.8059 search 


Looking for a zero in the interval [-1.28], 0.9051] 


25 0.784528 -0.911674 interpolation 
26 -0.247736 -0.999999 bisection 

27 -0.763868 -0.932363 bisection 

28 -1.02193 0.242305 bisection 

29 -0.968701 -0.27239 interpolation 
30 -0.996873 -0.0308299 interpolation 
31 -0.999702 -0.00297526 interpolation 
32 =1 5.53132e-006 interpolation 
33 =L -7.41965e-009 interpolation 
34 =1 -1.88738e-014 interpolation 
39 -1 0 interpolation 


Zero found in the interval: [-1.28, 0.9051]. 


-1 


Estos resultados ilustran la estrategia empleada por fzero cuando se tiene un valor único. 
Primero busca en la vecindad del valor inicial hasta detectar un cambio de signo. Después usa una 
combinación del método de bisección e interpolación para dirigirse a la raíz. La interpolación con- 
sidera tanto el método de la secante como la interpolación cuadrática inversa (recuerde la sección 
7.4). Deberá notar que el algoritmo de fzero puede implicar más cosas a partir de esta descripción 
básica. Puede consultar a Press et al. (2007) para mayores detalles. 


EJEMPLO 7.7 Uso de MATLAB para manipular y determinar las raíces de polinomios 


Planteamiento del problema Analicemos cómo se emplea MATLAB para manipular y deter- 
minar las raíces de polinomios. Use la siguiente ecuación del ejemplo 7.3, 

f00) =% - 3.54% + 2.751? + 2.1251? — 3.875x + 1.25 (E7.7.0) 
que tiene tres raíces reales: 0.5, —1.0, 2 y un par de raíces complejas: 1 + 0.51. 
Solución El polinomio se introduce en MATLAB almacenando los coeficientes como un vector. 


Por ejemplo, respondiendo a la instrucción en pantalla de MATLAB (>>), teclear e introducir la 
siguiente línea almacena los coeficientes en el vector a, 


>> a=[1 -3.5 2.75 2.125 -3.875 1.25]; 


Después se procede a manipular el polinomio. Por ejemplo, podemos evaluarlo en x = 1, tecleando 
>> polival (a, 1) 


que resultará 1(1)5 — 3.5(1)* + 2.75(1) + 2.125(1)? — 3.875(1) + 1.25=-0.25, 
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ans = 
-0.2500 


Para evaluar la derivada f(x) = 5x*— 14x? + 8.251? + 4.25x — 3.875 con 


>> polyder (a) 
ans = 
5.0000 -14.0000 8.2500 4.2500 -3.8750 


A continuación, se crea un polinomio cuadrático que tiene dos de las raíces originales de la ecuación 
(E7.7.1): 0.5 y —1. Esta cuadrática es (x — 0.5)(x + 1) = x? + 0.5x — 0.5 y se introduce en MATLAB 
como el vector b 


>> b=[1 0.5 -0.5]; 
Se divide el polinomio original entre este polinomio con 
>> [d, e] =deconv (a, b) 
El resultado de la división es (un polinomio de tercer grado d) y un residuo (e) 


d = 

1.0000 -4.0000 5.2500 -2.5000 
e = 

0 0 0 0 0 0 


Debido a que el polinomio es un divisor perfecto, el residuo polinominal tiene coeficientes iguales 
a cero. Ahora las raíces del cociente polinominal se determinan como 


>> roots (ad) 
con el resultado esperado para las raíces faltantes del polinomio original (E7.7.1) 


ans = 
2.0000 
1.0000 + 0.50001 
1.0000 - 0.5000i 


Ahora al multiplicar d por b se regresa al polinomio original 


>> conv (d, b) 
ans = 
1.0000 -3.5000 2.7500 2.1250 -3.8750 1.2500 


Finalmente, podemos determinar todas las raíces del polinomio original con 


>> r=ro0ts (a) 


Y = 
-1.0000 
2.0000 
1.0000 + 0.5000i 
1.0000 -— 0.50001 
0.5000 


7.7.3 Mathcad 


Mathcad tiene una función de modo numérico llamada root que es posible usar para resolver una 
ecuación de una sola variable. El método exige que usted suministre una función f(x), ya sea un 
valor inicial o un rango. Cuando se usa un solo valor inicial, root emplea los métodos Secant (o de 
la secante) y Miiller. En caso de que se suministren dos valores iniciales entre los cuales está com- 
prendida una raíz, utiliza una combinación del método Ridder (una variación del método de posición 
falsa) y del método de Brent. Itera hasta que la magnitud de f(x) en la raíz propuesta es menor que 
el valor predefinido de TOL. La implementación de Mathcad tiene ventajas y desventajas similares 
que los métodos convencionales de determinación de raíces, como lo que concierne a la calidad de 
los valores iniciales y la velocidad de convergencia. 
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Mathcad puede encontrar todas las raíces reales o complejas de polinomios con polyroots. Esta 
función de modo numérico o simbólico se basa en el método de Laguerre. Esta función no necesita 
valores iniciales, y todas las raíces las devuelve el sistema al mismo tiempo. 

Mathcad contiene una función de modo numérico que se llama Find, que se puede usar para 
resolver hasta 50 ecuaciones algebraicas simultáneas no lineales. La función Find elige un método 
adecuado de un grupo de métodos disponibles, dependiendo de si el problema es lineal o no lineal, 
y de otros atributos. Los valores aceptables para la solución pueden ser no restringidos o restringidos 
a caer dentro de límites especificados. Si Find no logra encontrar una solución que satisfaga las 
ecuaciones y las restricciones, produce un mensaje de error: “Did not find solution”. Sin embargo, 
Mathcad también contiene una función similar que se llama Minerr. Esta función da resultados de 
solución que minimizan el error en las restricciones, incluso en el caso de no poder encontrar solu- 
ciones exactas. Así, el problema de despejar las raíces de ecuaciones no lineales está estrechamente 
relacionado tanto con la optimización como con los mínimos cuadrados no lineales. Estas áreas y 
el Minerr se analizan a detalle en las partes cuatro y cinco. 

La figura 7/7 muestra una típica hoja de trabajo Mathcad. Los menús en la parte superior pro- 
porcionan rápido acceso a los operadores y a funciones aritméticas comunes y a las funciones, a 
varios tipos de gráficos de dos y tres dimensiones, y el ambiente para crear subprogramas. Se pueden 
colocar ecuaciones, texto, datos o gráficas en cualquier parte de la pantalla. Usted puede usar diver- 
sos tipos de impresión, colores y estilos para construir hojas de trabajo con casi cualquier diseño y 
formato que le agrade. Consulte el resumen del Manual del Usuario Mathcad (Mathcad User's Ma- 
nual) en el apéndice C, o el manual completo disponible en MathSoft. Observe que en todos los 
ejemplos de Mathcad hemos tratado de acomodar la sesión completa de Mathcad en una sola panta- 
lla. Usted debe percatarse de que la gráfica tendría que colocarse debajo de los comandos para que 
funcione correctamente. 

Se comenzará con un ejemplo que despeja la raíz de f(x) = x— cos x. El primer paso es introducir 
la función. Esto se hace tecleando f(x):, que Mathcad convierte automáticamente en f(x): =. La expre- 
sión := se llama símbolo de definición. En seguida se introduce un valor inicial de manera similar, 
usando el símbolo de definición. Ahora, la solución se define como root(f(x), x), que abre el método 
de secante con un valor inicial de 1.0. Se continúa la iteración hasta que f(x) evaluada en la raíz pro- 
puesta sea menor que TOL. El valor de TOL se ajusta a partir del menú desplegable de opciones 
matemáticas (Math/Options). Finalmente se muestra en pantalla el valor de la solución (soln) usando 
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SOLVING AN EQUATION WITH A SINGLE UNKNOWN 


Enter a function f(00): 


f(x) :=x— cos (x) 


Enter a given value for x: 


x:=1 


Solve for the root: 


soln := root(f(x),x) 


soln = 0.739085 


Figura 7.7 

Pantalla Mathcad para en- 
contrar la raíz de una sola 
ecuación. 


7.7 Localización de raíces con paquetes de software 


un signo igual normal (=). El número de cifras significativas se ajusta mediante el menú desplegable 
de formato de número Format/Number. Las marcas de texto y las definiciones de ecuaciones se pue- 
den colocar en cualquier parte de la pantalla con diversos tipos de letra, estilos, tamaños y colores. La 
gráfica se puede ubicar en cualquier parte de la hoja de trabajo haciendo clic en la ubicación deseada. 
Esto coloca una retícula roja en dicha ubicación. Luego use el menú de persiana Insert/Graph/X-Y Plot 
para colocar una gráfica vacía en la hoja de trabajo con espacios para las expresiones que se van a 
graficar y para los rangos de los ejes x y y. Simplemente teclee f(z) en el espacio sobre el eje y, y —10 
y 10 para el rango del eje z. Mathcad hace todo el resto para producir la gráfica que se muestra en la 
figura 7.7. Una vez que se ha creado la gráfica, usted puede usar el menú de persiana Format/Graph/X- 
Y Plot para variar el tipo de gráfica; cambiar el color, el tipo y el grosor de la línea de trazo de la 
función; y agregue títulos, rótulos y otras características. 

La figura 7.8 muestra cómo se puede usar Mathcad para encontrar las raíces de un polinomio 
usando la función polyroots. Primero, se introducen p(x) y v usando := el símbolo de definición. 
Observe que y es un vector que contiene los coeficientes del polinomio comenzando con el término 
de grado cero y terminando en este caso con un término de tercer grado. La siguiente r se define 
(usando :=) como polyroots(u), lo cual activa el método Laguerre. Las raíces contenidas en r se 
muestran como r” usando un signo de igual normal (=). En seguida se construye una gráfica de 
manera similar a la anterior, salvo que ahora se usan dos variables de rango, x y ¡, para definir el 
rango del eje x y la ubicación de las raíces. La variable de rango para x se construye tecleando x y 
luego “*:” (que aparece como :=) y luego -4, y después -3.99 y luego “*;” (que Mathcad transforma 
en ..), y finalmente 4. Esto crea un vector de valor x con rango de -4 a 4, con un incremento de 0.01 
para el eje x, con los valores correspondientes para p(x) en el eje y. La variable de rango ¡ se usa para 
crear tres valores para r y p(r), que se grafican como círculos individuales pequeños. Observe que, 
nuevamente, en el esfuerzo de acomodar toda la sesión Mathcad en una sola pantalla, se ha coloca- 
do la gráfica encima de los comandos. Usted debería darse cuenta de que la gráfica tendría que estar 
debajo de los comandos para que funcione correctamente. 

El último ejemplo muestra la solución de un sistema de ecuaciones no lineales usando un Ma- 
thcad Solve Block (figura 7.9). El proceso comienza usando el símbolo de definición para crear 
valores iniciales para x y y. La palabra Given alerta entonces a Mathcad de que lo que sigue es un 
sistema de ecuaciones. Luego siguen las ecuaciones y desigualdades (que no se usan aquí). Observe 
que, para esta aplicación, Mathcad necesita emplear un signo de igual simbólico que se teclea como 
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FINDING THE ROOT OF A POLYNOMIAL 
Input a polynomial: 


PG) :=x*-10x+2 
Input vector of coefficients, 
beginning with the constant term: 
$ 
—10 
0 
1 


Determine the roots: 


r := polyroots(v) 
r'=(-3.257897 0.20081 3.057087) 


Figura 7.8 Create a plot: 


Pantalla Mathcad para despejar 


, . x :=-4, -3.99..4 
raíces de polinomio. 


j:=0,1..2 


158 Capítulo 7 Raíces de polinomios 


'“YMiMathcad 


yl File Edit View Insert Format Tools Symbolics "Window Help 


SOLVING A NONLINEAR SYSTEM OF EQUATIONS 


Enter guesses for the n unknowns: 


x:=1 
y:=3.5 


Given 


Enter the n equations: 


x+xy-10=0 


y+3xy-37=0 
Solve the system: 
vec := Find(x, y) 


Solution: 


-b 


[Note: Use the symbolic equal sign [Ctrl= 
for equations within the Solve Block] 


Figura 7.9 

Pantalla Mathcad para 
resolver un sistema de 
ecuaciones no lineales. 


[Ctrl]= o < y > para separar los lados izquierdo y derecho de una ecuación. Ahora, se define la 
variable vec como Find (x,y), y se muestra el valor de vec usando un signo de igual. 


PROBLEMAS 


7.1 Divida la ecuación polinómica f(x) = x* — 7.51 + 14.57 + 3x 
— 20 entre el factor monómico x — 2. ¿Es x= 2 una raíz? 
7.2 Divida el polinomio f(x) = 1% — 51% + 1% — 61? —7x + 10 entre el 
monomio factor x— 2. 
7.3 Use el método de Miiller para determinar la raíz real positiva de 
a) fo=X+1-4x-4 

b f)=x1-0.51+4x-2 
7.4 Emplee el método de Miiller o MATLAB para determinar las 
raíces reales y complejas de 

a foa=Y*-12+2x-2 

DD fo)=2x+6+8 

O) foo)=x-2+6x2-2x+5 
7.5 Use el método de Bairstow para determinar las raíces de 

a) fo)=-2+6.2x- 4x1? + 0.7x% 

b) fG)=9.34-21.97x+ 16.3x? — 3.704x* 

CO) foo)=x-2+6x2-2x+5 


7.6 Desarrolle un programa para implementar el método de Miller. 
Pruébelo con la repetición del ejemplo 7.2. 

7.7 Emplee el programa que desarrolló en el problema 7.6 para de- 
terminar las raíces reales del problema 7.4a. Construya una gráfica 
(a mano, o con un paquete de software) para elegir valores iniciales 
apropiados. 

7.8 Desarrolle un programa para implementar el método de Bairstow. 
Pruébelo con la repetición del ejemplo 7.3. 

7.9 Use el programa que desarrolló en el problema 7.8 para deter- 
minar las raíces de las ecuaciones en el problema 7.5. 

7.10 Determine la raíz real de 135 = 80 con Excel, MATLAB o Ma- 
thcad. 


7.11 La velocidad de un paracaidista que cae está dada por 


v= gm a 3 elcmr, 
Cc 


donde g = 9.81 m/s?. Para un paracaidista con un coeficiente de 
arrastre c = 15 kg/s, calcule la masa m de modo que la velocidad sea 
v= 35 m/s en £=8 s. Use Excel, MATLAB o Mathcad para determi- 
nar m. 

7.12 Determine las raíces de las ecuaciones no lineales simultáneas 
siguientes: 


y=2+x+0.75 
y+5xy=xP 


Utilice valores iniciales para x = y = 1.2 y use la herramienta Solver 
de Excel, o alguna librería o paquete que elija. 

7.13 Determine las raíces de las ecuaciones no lineales simultáneas 
que siguen: 


-4+(G-4*=5 
2+y=16 


Use un método gráfico para obtener sus valores iniciales. Determine 
los estimados refinados con la herramienta Solver de Excel o alguna 
librería o paquete que elija. 

7.14 Realice las operaciones MATLAB idénticas a las del ejemplo 
7.7, 0 use algún software que elija, con objeto de encontrar todas las 
raíces de la ecuación polinomial 


FO) = (+2) + 5) — 6) — 4)(x — 8) 


Obsérvese que es posible usar la función poly para convertir las 
raíces en un polinomio. 

7.15 Use MATLAB o Mathcad para determinar las raíces de las 
ecuaciones en el problema 7.5. 

7.16 Un cilindro circular de dos dimensiones se coloca en un flujo 
de velocidad alta y uniforme. Se desprenden vórtices del cilindro a 
frecuencia constante, la cual detectan sensores de presión en la su- 
perficie posterior del cilindro por medio de calcular qué tan seguido 
oscila la presión. Dados tres puntos de los datos, use el método de 
Miiller para encontrar el momento en que la presión fue igual a cero. 


0.62 


Tiempo | 0.60 0.64 


Presión | 20 50 60 


7.17 Al tratar de encontrar la acidez de una solución de hidróxido 
de magnesio en ácido clorhídrico, se obtiene la ecuación siguiente: 


AGO) =x9 + 3.51? - 40 


donde xes la concentración del ion hidronio. Calcule la concentración 
del ion hidronio para una solución saturada (cuando la acidez es igual 
a cero) por medio de dos métodos diferentes en MATLAB (por 
ejemplo, en forma gráfica y la función roots). 

7.18 Considere el sistema siguiente con tres incógnitas a, u y u: 


u?-—2v?= a? 
u+v=2 

2 En 
at-2a-u=0 


Encuentre los valores reales de las incógnitas, por medio de a) Solver 
de Excel, y b) algún paquete de software de manipulación simbólica. 
7.19 En el análisis de sistemas de control, se desarrollan funciones 
de transferencia que relacionan en forma matemática la dinámica de 
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la entrada de un sistema con su salida. La función de transferencia 
para un sistema de posicionamiento robotizado está dada por: 


Cís)_  s +9s”+265+24 
M5) s+58+775* +1535 +90 


G(s)= 


donde G(s) = ganancia del sistema, C(s) = salida del sistema, M(s) = 
entrada del sistema y s = frecuencia compleja de la transformada de 
Laplace. Utilice una técnica numérica para obtener las raíces del 
numerador y el denominador, y factorícelas en la forma siguiente: 


Gs) = (s+aMs+a, Xs+a,) 
(s+b Ms +b,Xs+b,XMs+b,) 


donde a, y b;= las raíces del numerador y el denominador, respecti- 
vamente. 

7.20 Desarrolle una función de archivo M para el método de bisec- 
ción, en forma similar a la de la figura 5.10. Pruebe la función por 
medio de repetir los cálculos de los ejemplos 5.3 y 5.4. 

7.21 Desarrolle una función de archivo M para el método de la falsa 
posición. La estructura de su función debe ser similar al algoritmo 
de la bisección que se ilustra en la figura 5.10. Pruebe el programa 
por medio de repetir el ejemplo 5.5. 

7.22 Desarrolle una función de archivo M para el método de Newton- 
Raphson, con base en la figura 6.4 y la sección 6.2.3. Junto con el 
valor inicial, introduzca como argumentos la función y derivada. 
Pruébelo con la repetición del cálculo del ejemplo 6.3. 

7.23 Desarrolle una función de archivo M para el método de la se- 
cante, con base en la figura 6.4 y la sección 6.3.2. Junto con los dos 
valores iniciales, introduzca como argumento a la función. Pruébelo 
con la duplicación de los cálculos del ejemplo 6.6. 

7.24 Desarrolle una función de archivo M para el método de la se- 
cante modificado, con base en la figura 6.4 y la sección 6.3.2. Junto 
con el valor inicial y la fracción de perturbación, introduzca como 
argumento a la función. Pruébelo con la duplicación de los cálculos 
del ejemplo 6.8. 


Estudio de casos: 
raíces de ecuaciones 


La finalidad de este capítulo es utilizar los procedimientos numéricos analizados en los capítulos 5, 
6 y 7 para resolver problemas de ingeniería reales. Las técnicas numéricas son importantes en apli- 
caciones prácticas, ya que con frecuencia los ingenieros encuentran problemas que no es posible 
resolver usando técnicas analíticas. Por ejemplo, modelos matemáticos simples que se pueden resol- 
ver analíticamente quizá no sean aplicables cuando se trata de problemas reales. Debido a esto, se 
deben utilizar modelos más complicados. En esta situación, es conveniente implementar una solución 
numérica en una computadora. En otros casos, los problemas de diseño en la ingeniería llegan a 
requerir soluciones de variables implícitas en ecuaciones complicadas. 

Las siguientes aplicaciones son típicas de aquellas que en forma rutinaria se encuentran duran- 
te los últimos años de estudio y en estudios superiores. Más aún, son problemas representativos de 
aquellos que se encontrarán en la vida profesional. Los problemas provienen de las cuatro grandes 
ramas de la ingeniería: química, civil, eléctrica y mecánica. Dichas aplicaciones también sirven para 
ilustrar las ventajas y desventajas de las diversas técnicas numéricas. 

La primera aplicación, tomada de la ingeniería química, proporciona un excelente ejemplo de 
cómo los métodos para determinar raíces permiten usar fórmulas realistas en la ingeniería práctica; 
además, demuestra de qué manera la eficiencia del método de Newton-Raphson se emplea cuando 
se requiere de un gran número de cálculos como método para la localización de raíces. 

Los siguientes problemas de diseño en ingeniería se toman de las ingenierías civil, eléctrica y 
mecánica. La sección 8.2 usa la bisección para determinar cambios en la química del agua de lluvia 
debidos al aumento de dióxido de carbono en la atmósfera. En la sección 8.3 se explica cómo las 
raíces de ecuaciones trascendentes se usan en el diseño de un circuito eléctrico. En las secciones 8.2 
y 8.3 también se muestra de qué forma los métodos gráficos ofrecen un conocimiento del proceso 
de localización de raíces. La sección 8.4 usa diversos métodos numéricos para calcular el factor de 
fricción para flujo de fluidos en un tubo. 


8.1 LEYES DE LOS GASES IDEALES Y NO IDEALES 
(INGENIERÍA QUÍMICA Y BIOQUÍMICA) 


Antecedentes La ley de los gases ideales está dada por 
pV=nRT (8.1) 


donde p es la presión absoluta, V es el volumen, n es el número de moles, R es la constante universal 
de los gases y Tes la temperatura absoluta. Aunque esta ecuación se utiliza ampliamente por los in- 
genieros y científicos, sólo es exacta en un rango limitado de presión y temperatura. Además, la 
ecuación (8.1) es apropiada solamente para algunos gases. 

Una ecuación de estado alternativa para los gases está dada por: 


(»+<) (v-b)=RT (8.2) 
10) 


conocida como la ecuación de Van der Waals, donde v = V/n es el volumen molar, a y b son cons- 
tantes empíricas que dependen del gas que se analiza. 

Un proyecto de diseño en ingeniería química requiere que se calcule exactamente el volumen 
molar (v) del dióxido de carbono y del oxígeno para diferentes combinaciones de temperatura y 


8.1 Leyes de los gases ideales y no ideales (ingeniería química y bioquímica) 


presión, de tal forma que los recipientes que contengan dichos gases se puedan seleccionar apropia- 
damente. También es importante examinar qué tan bien se apega cada gas a la ley de los gases 
ideales, comparando el volumen molar calculado con las ecuaciones (8.1) y (8.2). Se proporcionan 
los siguientes datos: 


R=0.082054 L atm/(mol K) 


a= 3.592 ) dióxido de carbono 
b=0.04267 
a=1.360 , Ñ 
oxígeno 
b= 0.03183 


Las presiones de diseño de interés son de 1, 10 y 100 atmósferas para combinaciones de temperatu- 
ra de 300, 500 y 700 K. 


Solución Los volúmenes molares de ambos gases se calculan usando la ley de los gases ideales, 
con n = 1. Por ejemplo, si p = 1 atm y T=300 K, 


v=2=*FE 0082054 241 TK 


n p molK l atm 


=24.6162 L/mol 


Estos cálculos se repiten para todas las combinaciones de presión y de temperatura que se presentan 
en la tabla 8.1. 

Los cálculos del volumen molar a partir de la ecuación de Van der Waals se llevan a cabo usan- 
do cualquiera de los métodos numéricos para la determinación de raíces de ecuaciones analizados 
en los capítulos 3, 6 y 7, con 


Tabla 8.1 Cálculos del volumen molar. 


Volumen Volumen molar Volumen molar 


molar (ley de los (Van der Waals) (Van der Waals) 
Temperatura, Presión, gases ideales), Dióxido de carbono, Oxígeno, 
K atm L/mol L/mol L/mol 
300 1 24.6162 24.5126 24.5928 
10 2.4616 2.3545 2.4384 
100 0.2462 0.0795 0.2264 
500 1 41.0270 40.9821 41.0259 
10 4.1027 4.0578 4.1016 
100 0.4103 0.3663 0.4116 
700 1 57.4378 57.4179 57.4460 
10 5.7438 5.7242 5.7521 
100 0.5744 0.5575 0.5842 
a 
1 -(0+ e Jo b)-RT (8.3) 


En este caso, como la derivada de f(v) se determina fácilmente, entonces es conveniente y eficiente 
usar el método de Newton-Raphson. La derivada de f(v) respecto a v está dada por 


A 2ab 
fo=» +2 (8.4) 
V V 


El método de Newton-Raphson se describe mediante la ecuación (6.6): 
Vjy1 20 ai 
fF(u,) 
la cual se utiliza para estimar la raíz. Por ejemplo, usando como valor inicial 24.6162, el volumen 


molar del dióxido de carbono a 300 K y 1 atmósfera es 24.5126 L/mol. Este resultado se obtuvo 
después de sólo dos iteraciones y tiene un £,, menor del 0.001 por ciento. 
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Capítulo 8 Estudio de casos: raíces de ecuaciones 


En la tabla 8.1 se muestran resultados similares para todas las combinaciones de presión y de 
temperatura de ambos gases. Se observa que los resultados obtenidos con la ecuación de los gases 
ideales difieren de aquellos obtenidos usando la ecuación de Van der Waals, para ambos gases, de- 
pendiendo de los valores específicos de p y T. Además, como algunos de dichos resultados son 
significativamente diferentes, el diseño de los recipientes que contendrán a los gases podría ser muy 
diferente, dependiendo de qué ecuación de estado se haya empleado. 

En este problema, se examinó una complicada ecuación de estado con el método de Newton- 
Raphson. En varios casos los resultados variaron de manera significativa respecto a la ley de los 
gases ideales. Desde un punto de vista práctico, el método de Newton-Raphson fue apropiado aquí, 
ya que f'(v) resultó sencillo de calcular. De esta manera, es factible explotar las propiedades de rá- 
pida convergencia del método de Newton-Raphson. 

Además de demostrar su poder en un solo cálculo, este problema de diseño muestra cómo el 
método de Newton-Raphson es especialmente atractivo cuando se requiere una gran cantidad de 
cálculos. Debido a la velocidad de las computadoras digitales, la eficiencia de varios métodos nu- 
méricos en la solución para la mayoría de las raíces de ecuaciones no se distingue en un cálculo 
único. Incluso una diferencia de 1 s entre el método de bisección y el eficiente método de Newton- 
Raphson no significa pérdida de tiempo cuando se realiza sólo un cálculo. Sin embargo, suponga 
que para resolver un problema se necesita calcular millones de raíces. En tal caso, la eficiencia del 
método podría ser un factor decisivo al elegir una técnica. 

Por ejemplo, suponga que se requiere diseñar un sistema de control computarizado automático 
para un proceso de producción de sustancias químicas. Dicho sistema requiere una estimación exac- 
ta de volúmenes molares sobre una base esencialmente continua, para fabricar en forma convenien- 
te el producto final. Se instalan medidores que proporcionan lecturas instantáneas de presión y 
temperatura. Se deben obtener valores de v para diversos gases que se usan en el proceso. 

Para una aplicación como ésta, los métodos cerrados, como el de bisección o de la falsa posición, 
posiblemente consumirían mucho tiempo. Además, los dos valores iniciales que se requieren en 
estos métodos generarían un retraso crítico en el procedimiento. Dicho inconveniente afecta de igual 
forma al método de la secante, que también necesita dos valores iniciales. 

En contraste, el método de Newton-Raphson requiere sólo de un valor inicial para determinar 
la raíz. La ley de los gases ideales podría emplearse para obtener un valor inicial del proceso. Des- 
pués, suponiendo que el tiempo empleado sea lo bastante corto como para que la presión y la tem- 
peratura no varíen mucho entre los cálculos, la solución de la raíz anterior se puede usar como un 
buen valor inicial para la siguiente aplicación. De esta forma, se tendría de forma automática un va- 
lor inicial cercano a la solución, que es requisito indispensable para la convergencia del método de 
Newton-Raphson. Todas estas consideraciones favorecerán de buena manera la técnica de Newton- 
Raphson en estos problemas. 


8.2 LOS GASES DE INVERNADERO Y LA LLUVIA 
(INGENIERÍA CIVIL Y AMBIENTAL) 


Antecedentes La ingeniería civil es un amplio campo que abarca áreas tan diversas como las 
ingenierías estructural, geotérmica, de transporte, de recursos hidráulicos y ambiental. Esta última 
tradicionalmente se ha enfocado en el control de contaminación. Sin embargo, en años recientes, los 
ingenieros ambientales (así como los ingenieros químicos) se han centrado en problemas más amplios 
como el cambio climático. 

Está bien documentado que los niveles atmosféricos de diversos gases de invernadero han ido 
aumentando durante los últimos 50 años. Por ejemplo, la figura 8.1 muestra datos para la presión 
parcial de dióxido de carbono (CO,) recabados en Mauna Loa, Hawai, de 1958 a 2003. La tendencia 
de los datos se puede acomodar muy bien a un polinomio cuadrático (en la parte cinco aprenderá a 
determinar tales polinomios), 


Pco, = 0.011825(t — 1980.5)” + 1.356975(+— 1980.5) + 339 


donde pco, = presión parcial del CO, en la atmósfera [ppm]. Los datos indican que los niveles han 
aumentado más de 19% durante el periodo, de 315 a 376 ppm. 


8.2 Los gases de invernadero y la lluvia (ingeniería civil y ambiental) 
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Promedio anual de presiones parciales de dióxido de carbono atmosférico [ppm] medidas en 
Mauna Loa, Hawai. 


Además del calentamiento global, los gases de invernadero también pueden influir en la quími- 
ca atmosférica. Una pregunta que se puede hacer es cómo la tendencia de aumento en el dióxido de 
carbono está afectando el pH del agua de lluvia. Fuera de las zonas urbanas e industriales, está bien 
documentado que el dióxido de carbono es el principal determinante del pH de la lluvia. El pH es la 
medida de la actividad de los ¡ones hidrógeno y, por lo tanto, de la acidez. Para soluciones acuosas 
diluidas, se puede calcular como 


pH = — log¡p[H*] (8.5) 


donde [H*] es la concentración molar de iones de hidrógeno. 
El siguiente sistema no linear de ecuaciones determina la química del agua de lluvia: 


+ Poo 
K¡= ¡ps LE ILHCO; ] (8.6) 
Kypco, 
H+][co?- 
K,= ATEO sE ] (8.7) 
[HCO; ] 
K,y =[H*][OH ] (8.8) 
— £uPco | 15co7] + [co2 8 
cr = 56 +IHCO;]+[CO3”] (8.9) 
0 = [HCO;] + 2[C05”] + [OH”] — [H*] (8.10) 


donde K, = constante de Henry, y K¡, K, y K,, son los coeficientes de equilibrio. Las cinco incógni- 
tas en el sistema de cinco ecuaciones no lineales son cy= carbono inorgánico total, [HCO; ] = bicar- 
bonato, [COF] = carbonato, [H*] = ion de hidrógeno, [OH] = ion de hidroxilo. Observe cómo 
aparece la presión parcial de CO, en las ecuaciones (8.6) y (8.9). 

Use estas ecuaciones para calcular el pH del agua de lluvia dado que Ky = 10%, K, = 
1073, K,= 107% y K,,=107**, Compare los resultados en 1958, cuando la p./, era de 315, y en 
2003, cuando era de 375 ppm. Al seleccionar un método numérico para su cálculo, considere lo 
siguiente: 
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+ Usted sabe con certeza que el pH de la lluvia en áreas limpias siempre cae entre 2 y 12. 
+ También sabe que sus dispositivos de medición sólo pueden medir pH con una precisión de hasta 
dos cifras decimales. 


Solución Hay diversas maneras de resolver este sistema no lineal de cinco ecuaciones. Una forma 
es eliminar incógnitas combinándolas para producir una sola función que sólo depende de [H*]. Para 
hacer esto, primero resuelva las ecuaciones (8.6) y (8.7) para despejar: 


. K; 
[HCO, ] = LO An Poo, (8.11) 
0 K,[HCO; ] 
Cco?] = E (8.12) 
PA [H7] 
Sustituya la ecuación (8.11) en la (8.12) 
K,K 
2- 2Ki 
[CO;”] = op 40 Pco, (8.13) 


Las ecuaciones (8.11) y (8.13) se pueden sustituir junto con la ecuación (8.8) en la ecuación (8.10) 
para dar 

pa Lo y ¿Lu — [H*] 8.14 

01H HPco, 10514 HPCO, 144] (8.14) 
Aunque podría no ser evidente, este resultado es un polinomio de tercer grado en [H*]. Así, su raíz 
se puede usar para calcular el pH del agua de lluvia. 

Ahora debemos decidir qué método numérico debemos emplear para obtener la solución. Hay 
dos razones por las que la bisección sería una buena elección. La primera es que el hecho de que 
el pH siempre cae dentro del rango de 2 a 12 nos proporciona dos valores iniciales; la segunda 
razón es que, como el pH se puede medir sólo hasta dos cifras decimales de precisión, será satis- 
factorio un error absoluto de £, ¿= 0.005. Recuerde que, dado un acontecimiento inicial y el error 
relativo deseado, podemos calcular a priori el número de iteraciones. Usando la ecuación (3.5), el re- 
sultado es n = log,(10)/0.005 = 10.96538. Así, once iteraciones de bisección producirán la precisión 
deseada. 

Si se hace esto, el resultado para 1958 será un pH de 5.6279, con un error relativo de 0.0868%. 
Se puede confiar en que el resultado redondeado de 5.63 es correcto hasta 2 cifras decimales. Esto 
se puede verificar realizando otra corrida con más iteraciones. Por ejemplo, si se realizan 35 ite- 
raciones, se obtiene un resultado de 5.6304, con un error relativo aproximado de €,=5.17 x 10%. 
Se puede repetir el mismo cálculo para las condiciones de 2003 para dar pH = 5.59, con €, = 
0.0874%. 

Es interesante que estos resultados indican que una elevación de 19% en los niveles de CO, 
atmosférico ha producido sólo una caída de 0.67% en el pH. Aunque esto es ciertamente verdadero, 
recuerde que el pH representa una escala logarítmica como se define en la ecuación (8.5). En con- 
secuencia, una caída de 1 unidad en pH representa un aumento de 10 veces en ¡ones de hidrógeno. 
La concentración se puede calcular como [H*] = 10", y el cambio resultante en el porcentaje se 
puede calcular como 9.1%. Por lo tanto, la concentración de iones de hidrógeno ha aumentado en 
alrededor de 9%. 

Hay una considerable controversia en relación con la verdadera importancia de las tendencias 
de los gases de invernadero. Sin embargo, independientemente de las implicaciones finales, es bas- 
tante aleccionador darse cuenta de que algo tan grande como nuestra atmósfera ha cambiado tanto 
a lo largo de un periodo relativamente corto. Este estudio de caso ilustra cómo se pueden emplear 
los métodos numéricos para analizar e interpretar tales tendencias. Durante los próximos años se 
espera que los ingenieros y los científicos puedan usar estas herramientas para lograr un mejor en- 
tendimiento y ayudar a la racionalización del debate sobre sus ramificaciones. 


8.3 Diseño de un circuito eléctrico (ingeniería eléctrica) 
8.3 DISEÑO DE UN CIRCUITO ELÉCTRICO (INGENIERÍA ELÉCTRICA) 


Antecedentes Los ingenieros eléctricos emplean las leyes de Kirchhoff para estudiar el compor- 
tamiento de los circuitos eléctricos en estado estacionario (que no varía con el tiempo). En la sección 
12.3 se analiza el comportamiento de dichos estados estacionarios. Otro problema importante tiene 
que ver con circuitos de naturaleza transitoria, donde súbitamente ocurren cambios temporales. Esta 
situación se presenta cuando se cierra el interruptor como en la figura 8.2. En tal caso, existe un 
periodo de ajuste al cerrar el interruptor hasta que se alcance un nuevo estado estacionario. La lon- 
gitud de este periodo de ajuste está íntimamente relacionada con las propiedades de almacenamien- 
to de energía, tanto del capacitor como del inductor. La energía almacenada puede oscilar entre 
estos dos elementos durante un periodo transitorio. Sin embargo, la resistencia en el circuito disipa- 
rá la magnitud de las oscilaciones. 
El flujo de corriente a través del resistor provoca una caída de voltaje (Vz), dada por 


Ve = ¡R 
donde ¡ = la corriente y R = la resistencia del resistor. Si las uni- —». 
dades de R e ¡son ohms y amperes, respectivamente, entonces las Interruptor .— 
unidades de V son voltios. E iz 

De manera semejante, un inductor se opone a cambios de Batería a Vo , Capacitor 


corriente tales que la caída del voltaje a través del inductor V, es 


a 


donde £ = la inductancia. Si las unidades de L e ¡ son henrios y Figura 8.2 


Resistor 
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Inductor 


amperes, respectivamente, entonces las de V, son voltios, y las de Un circuito eléctrico. Cuando se cierra el interruptor, la 
t son segundos. corriente experimenta una serie de oscilaciones hasta que 


La caída del voltaje a través del capacitor (V¿) depende de la se alcance un nuevo estado estacionario. 


carga (q) sobre éste: 


v.= E (8.15) 


donde C = la capacitancia. Si las unidades de carga se expresan en coulombios, entonces la unidad 
de C es el faradio. 

La segunda ley de Kirchhoff establece que la suma algebraica de las caídas de voltaje alrededor 
de un circuito cerrado es cero. Así que, después de cerrar el interruptor se tiene 


di 
1er <p (8.16) 
dt C 
Sin embargo, como la corriente se relaciona con la carga de acuerdo con 


Pb (8.17) 


1 
L=>+R=+>q=0 (8.18) 


Esta es una ecuación diferencial ordinaria lineal de segundo grado que se resuelve usando los mé- 
todos de cálculo. Esta solución está dada por 


1 RY 
q0=que 4" cos (E) t (8.19) 


166 


Figura 8.3 

La carga en un capaci- 
tor como función del 
tiempo después de 
cerrar el interruptor de 
la figura 8.2. 
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donde t=0, q=qp= VoC y Vo = el voltaje de la batería. La ecuación (8.19) describe la variación de 
la carga en el capacitor. La solución q(1) se grafica en la figura 8.3. 

Un problema de diseño típico en ingeniería eléctrica consistiría en la determinación del resistor 
apropiado para disipar energía a una razón especificada, con valores conocidos de £ y C. En este 
problema, suponga que la carga se debe disipar a 19% de su valor original (q/q, = 0.01) en+=0.05 s, 
conL=5HyC=10*F 


Solución Es necesario despejar R de la ecuación (8.19) con valores conocidos para q, qo, L y C. 
Sin embargo, debe emplear una técnica de aproximación numérica, ya que R es una variable implí- 
cita en la ecuación (8.19). Se usará el método de bisección para dicho propósito. Los otros métodos 
estudiados en los capítulos 5 y 6 también son apropiados; aunque el método de Newton-Raphson 
tiene el inconveniente de que la derivada de la ecuación (8.19) es un poco complicada. Reordenando 
la ecuación (8.19), 


2 
fR)=e*"" cos , ( da ) pes 
LC 42L do 


utilizando los valores numéricos dados, 


f(R)=e 9% cos [,/2000—0.01R? (0.05)]-0.01 (8.20) 


Examinando esta ecuación sugiere que un rango inicial razonable para R es O a 400 22 (ya que 2000 
— 0.01R? debe ser mayor que cero). La figura 8.4 es una gráfica de la ecuación (8.20), que confirma 
lo anterior. Al hacer veintiún iteraciones con el método de bisección se obtiene una raíz aproximada 
R = 328.1515 Q, con un error menor al 0.0001 por ciento. 

De esta forma, se especifica un resistor con este valor para el circuito mostrado en la figura 8.2 
y se espera tener una disipación consistente con los requisitos del problema. Este problema de dise- 
ño no se podría resolver eficientemente sin el uso de los métodos numéricos vistos en los capítulos 
5 y 6. 


8.4 FRICCIÓN EN TUBOS (INGENIERÍA MECÁNICA Y AEROESPACIAL) 


Antecedentes La determinación del flujo de fluidos en tuberías y mangueras tiene gran im- 
portancia en muchas áreas de la ingeniería y de la ciencia. En la ingeniería mecánica y en la ae- 
roespacial, las aplicaciones típicas incluyen el flujo de líquidos y gases a través de sistemas de 
enfriamiento. 

Los parámetros de la resistencia al flujo en tales conductos están determinados por un número 
adimensional que se llama factor de fricción. Para flujo turbulento, la ecuación de Colebrook pro- 
porciona un medio para calcular el factor de fricción, 


0 ! + 2.01 E + 29 (8.21) 
= —= VIO RN PRETETA A A 
VT EL37D ' ReyF 


donde € = rugosidad (m), D = diámetro (m) y Re = el número de Reynolds, 


_ PD 
17 


Re 


donde p = densidad del fluido [kg/m*], V = velocidad [m/s] y yu = viscosidad dinámica [N-s/m?]. 
Además de aparecer en la ecuación (8.21), el número de Reynolds también sirve como criterio de si 
el flujo es turbulento (Re > 4000). 


En el presente estudio de caso, se ilustrará cómo se pueden utilizar los métodos numéricos que 
se tratan en esta parte del libro para determinar f para flujo de aire por un tubo liso y delgado. 
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Para este caso, los parámetros son P = 1.23 kg/m', y= 1.79 x 10? 
N + s/m?, D=0.005 m, V=40 m/s y € =0.0015 mm. Observe que 
los factores de fricción están comprendidos entre alrededor de 
0.008 y 0.08. Además, la formulación explícita, llamada ecuación 
de Swamee-Jain, proporciona un cálculo aproximado, 


1.325 


' € ANT 
2 (37D Y Re 


Solución El número de Reynolds se puede calcular como 


f= (8.22) 


pVD 1.23(40)0.005 
Re = =S 
17) 1.79 x 1075 


= 13743 


Este valor, junto con los otros parámetros, se puede sustituir en 
la ecuación (8.21) para dar 


¿=P ( 


0.0000015 251 ) 
Vf 


3.7(0.005) id 13743/f 


Antes de determinar la raíz, es aconsejable graficar la función 
para estimar los valores iniciales y para anticipar dificultades 
posibles. Esto se puede hacer fácilmente con herramientas como 
MATLAB, Excel o Mathcad. Por ejemplo, es posible generar una 
gráfica de la función con los siguientes comandos de MATLAB 


FR) 4 


Raíz = 325 


0.0 


0.2 


0.4 


-0.6 


Figura 8.4 
Gráfica de la ecuación (8.20) que se usa para obtener los 
valores iniciales de R que abarcan la raíz. 


>> rho=1.23;mu=1.79%e-5;D=0.005;V=40;e=0.0015/1000; 


>> Re=rho*V*D/mu; 


>> g= (f) 1/sqrt (£)+2* 10910 (e/ (3.7*D)+2.51/(Re*sqrt (£))); 
>> fplot (g, [0.008 0.081) ,grid,xlabel('£'),ylabel (“g(£)” 


Como en la figura 8.5, la raíz se ubica en alrededor de 0.03. 


) 


Como se dan los valores iniciales (x, = 0.008 y x, = 0.08), se puede usar cualquiera de los mé- 
todos cerrados del capítulo 5. Por ejemplo, la bisección da un valor de f= 0.0289678, con un error 
porcentual relativo del error de 5.926 x 10” en 22 iteraciones. El método de falsa posición da un 
resultado de precisión similar en 26 iteraciones. Así, aunque producen el resultado correcto, son algo 


ineficientes. Esto no sería importante para una sola aplicación, 
pero podría resultar prohibitivo si se hicieran muchas evaluaciones. 

Se podría tratar de obtener un desempeño mejorado recurrien- 
do a un método abierto. Como la ecuación (8.21) es relativamente 
fácil de diferenciar, el método de Newton-Raphson es un buen 
candidato. Por ejemplo, usando un valor inicial en el extremo 
inferior del rango (xy = 0.008). Newton-Raphson converge rápi- 
damente a 0.0289678, con un error aproximado de 6.87 x 10% 
en sólo 6 iteraciones. Sin embargo, cuando el valor inicial se ubi- 
ca en el extremo superior del rango (xy = 0.08), ¡la rutina diverge! 

Como se puede ver al observar la figura 8.5, esto sucede 
porque la pendiente de la función en el valor inicial hace que la 
primera iteración salte a un valor negativo. Las corridas siguientes 
demuestran que, para este caso, la convergencia sólo ocurre cuan- 
do el valor inicial es menor de alrededor de 0.066. 

De modo que se puede ver que, aunque Newton-Raphson es 
muy eficiente, necesita buenos valores iniciales. Para la ecuación 
de Colebrook, una buena estrategia sería emplear la ecuación de 
Swamee-Jain [ecuación (8.22)] para dar un valor inicial como en 


84) 
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Figura 8.5 
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Figura 8.6 
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1.325 
f= 3 =0.029031 


0.0000015 5.74 
In + 05 
3.7(0.005) — 13743" 
Para este caso, Newton-Raphson converge en sólo 3 iteraciones rápidamente a 0.0289678 con un 
error aproximado de 8.51 x 107%. 
Además de estas funciones simples, se pueden también usar determinadores profesionales de 
raíces, como la función incorporado £zero de MATLAB. Sin embargo, al igual que con el método 


Newton-Raphson, también ocurre divergencia cuando se usa la función £zero con un solo valor. Sin 
embargo, en este caso, los valores en el extremo inferior del rango causan problemas. Por ejemplo, 


>> rho=1.23;mu=1.79e-5;D=0.005;V=40;e=0.0015/1000;5 

>> Re=rho*V*D/mu 

>> g=4 (f) 1/sqrt (£)+2*1o0g10(e/ (3.7*D)+2.51/(Re*sqrt (f))); 
>> fzero(g,0.008) 


Exiting fzero: aborting search for an interval containing a 
sign change because complex function value encountered 
during search. (Function value at -0.0028 is -4.92028- 
20.2423i.) 
Check function or try again with a different starting value. 
ans = 

NaN 


Si las iteraciones se muestran en pantalla usando optimset (recuerde la sección 7.7.2), se revela 
que ocurre un valor negativo durante la fase de búsqueda antes de que se detecte el cambio de signo 
y la rutina aborte. Sin embargo, para valores iniciales únicos superiores de alrededor de 0.016, la 
rutina trabaja muy bien. Por ejemplo, para el valor de 0.08 que causó problemas para el método 
Newton-Raphson, £fzero funciona muy bien. 


>> fzero(g,0.08) 


ans = 
0.02896781017144 


Y, como nota final, veamos si es posible la convergencia para iteración sencilla de punto fijo. 
La versión más fácil y directa consiste en despejar la primera Fen la ecuación (8.21), 


0.25 


; € EST AY 
(os 5 * 77) 


La gráfica de 2 curvas de esta función indica un resultado 
sorprendente (figura 8.6). Recuerde que la iteración de punto fijo 
converge cuando la curva y, tiene una pendiente relativamente 
baja (es decir, lgE) < 1). Como se indica en la figura 8.6, el 
hecho de que la curva y, tenga pendiente bastante baja en el rango 


fiv = (8.23) 


Y, = 84) 


de f= 0.008 a 0.08, significa que la iteración de punto fijo no sólo 
converge, sino que lo hace con bastante rapidez. De hecho, para 
valores iniciales entre 0.008 y 0.08, la iteración de punto fijo da 
predicciones con errores relativos porcentuales menores de 0.008% 
en seis o menos iteraciones. Así, este sencillo método que sólo 
necesita un valor y no necesita estimados de derivada funciona 


=Y 


bastante bien para este caso particular. 

El mensaje que se debe sacar de este estudio de caso es que 
incluso un gran software, profesionalmente desarrollado como el 
MATLAB no siempre es a prueba de errores. Además, normal- 
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mente no hay un solo método que funcione mejor para los problemas. Los usuarios experimentados 
entienden las fuerzas y las debilidades de las técnicas numéricas disponibles. Además, entienden 
suficiente de la teoría subyacente, de modo que pueden manejar eficazmente situaciones en las que 


un método falla. 


PROBLEMAS 


Ingeniería química/ingeniería bioquímica 

8.1 Realice el mismo cálculo que en la sección 8.1, pero para aceto- 
na (a = 12.02 y b= 0.08407) a una temperatura de 375 K y p de 2.0 
atm. Compare sus resultados con la ley de gases ideales. Use cual- 
quiera de los métodos numéricos explicados en los capítulos 5 y 6 
para realizar el cálculo. Justifique su elección de técnica. 

8.2 En ingeniería química, los reactores de flujo tipo tapón (es decir, 
aquellos en que el fluido va de un extremo al otro con una mezcla 
mínima a lo largo del eje longitudinal) se usan para convertir reac- 
tantes en productos. Se ha determinado que la eficiencia de la con- 
versión algunas veces se mejora recirculando una porción de la 
corriente del producto, de tal forma que regrese a la entrada para un 
paso adicional a través del reactor (figura P8.2). La razón de recir- 
culación se define como 


ñe volumen de fluido que regresa a la entrada 
volumen que sale del sistema 
Suponga que se está procesando una sustancia química A para generar 
un producto B. Para el caso en que A forma a B de acuerdo con una 
reacción autocatalítica (es decir, en la cual uno de los productos actúa 
como catalizador o estimulante en la reacción), es posible demostrar 
que una razón óptima de recirculación debe satisfacer 


R+1 
RH+ RA=X,,)] 


1+ RX) 
E a 
Ri=X,4) 


donde X,, es la fracción del reactante A que se convierte en el pro- 
ducto B. La razón óptima de recirculación corresponde a 
un reactor de tamaño mínimo necesario para alcanzar el nivel desea- 
do de conversión. Utilice un método numérico para determinar la 
razón de recirculación necesaria, de manera que se minimice el ta- 
maño del reactor para una conversión fraccional de X,¿=0.9. 


Producto 


Alimentación 


Reactor de flujo 
> 


tipo tapón 


Reciclaje 


Figura P8.2 
Representación esquemática de un reactor de flujo tipo tapón 
con recirculación. 


8.3 En un proceso de ingeniería química el vapor de agua (H,0) se 
calienta a temperaturas lo suficientemente altas para que una porción 
significativa del agua se disocie, o se rompa, para formar oxígeno 
(O,) e hidrógeno (H»): 


HO = H, + +0, 


Si se supone que ésta es la única reacción que se lleva a cabo, la 
fracción molar x de HO que se disocia se representa por 


k=* 2p, 
l1-x12+x 


donde K = la constante de equilibrio de la reacción y p,= la presión 
total de la mezcla. Si p,= 3 atm y K= 0.05, determine el valor de x 
que satisfaga la ecuación (P8.3.1). 

8.4 La siguiente ecuación permite calcular la concentración de un 
químico en un reactor donde se tiene una mezcla completa: 


(P8.3.1) 


c= Com( 1 _ 00 + Eje 


Si la concentración inicial es cy =4 y la concentración de entrada es 
Cen = 10, calcule el tiempo requerido para que c sea el 93% de Cay. 
8.5 Una reacción química reversible 


2A+4B=C 
se puede caracterizar por su relación de equilibrio 


Co 


2 
Ca Cb 


donde la nomenclatura c; representa la concentración del componen- 
te ¿. Suponga que definimos una variable x para representar el número 
de moles de C que se producen. Se puede usar la conservación de la 
masa para reformular la relación de equilibrio como 


_ (C..0 +x) 
(Ca,o — 2x)?(cp,0 — x) 


donde el subíndice O designa la concentración inicial de cada com- 
ponente. Si K= 0.015, cy = 42, Cpo = 30 y C.y = 4, determine el 
valor de x. a) Obtenga la solución gráficamente. b) Con base en a), 
despeje la raíz con valores iniciales de x, = 0 y x, = 20 hasta €, = 
0.5%. Elija ya sea bisección o falsa posición para obtener su solución. 
Justifique su elección. 

$.6 Las siguientes reacciones químicas se llevan a cabo en un siste- 
ma cerrado 


2A+B = C 
A+D =C 


En equilibrio, éstas pueden caracterizarse por 


donde la nomenclatura representa la concentración del componente 
i. Si x, y x, son el número de moles de C que se producen debido a la 
primera y segunda reacciones, respectivamente, emplee un método 
similar al del problema 8.5 para reformular las relaciones de equi- 
librio en términos de las concentraciones iniciales de los componen- 
tes. Después, use el método de Newton-Raphson para resolver el par 
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de ecuaciones simultáneas no lineales para x, y x, si K, =4x 10%, K, 
=3.7x 107, c,9=50, Cp0=20, C.0=5 y Co = 10. Utilice un método 
gráfico para proponer los valores iniciales. 

8.7 La ecuación de estado de Redlich-Kwong está dada por 


RT a 
v=b vuu+b)vT 
donde R = la constante universal de los gases [= 0.518 kJ/(kg K)], 
T= temperatura absoluta (K), p = presión absoluta (kPa) y v = volu- 


men de un kg de gas (m%/kg). Los parámetros a y b se calculan me- 
diante 


p= 


272.5 


Cc T. 
b = 0.0866R— 


Pe Pe 


a = 0.427 


donde p.= presión crítica (kPa) y 7, = temperatura crítica (K). Como 
ingeniero químico, se le pide determinar la cantidad de combustible 
metano (p, = 4 600 kPa y 7. = 191 K) que se puede almacenar en un 
tanque de 3 m* a una temperatura de -40*C con una presión de 65000 
kPa. Emplee el método de localización de raíces de su elección para 
calcular v y luego determine la masa de metano contenida en el 
tanque. 

8.8 El volumen V de un líquido contenido en un tanque horizontal 
cilíndrico de radio r y longitud L está relacionado con la profundidad 
del líquido h por 


- h 
V = cos! (2) = (r= h)V2rh — le 
r 
Determine h dados r=2 m, L=5 m y V= 8 m'. Observe que si usted 
está usando un lenguaje de programación o una herramienta de soft- 
ware que no tenga abundancia de funciones trigonométricas, el arco 
coseno se puede calcular con 


cos lx = 7 ca Ed ) 
2 V1-*XÉ 


8.9 El volumen V del líquido contenido en un tanque esférico de 
radio r está relacionado con la profundidad h del líquido por 


arh?(3r — h) 
3 
Determine h para r= 1 m y V=0.5 mé. 


8.10 Para el tanque esférico del problema 8.9, es posible desarrollar 
las siguientes dos fórmulas para el método de punto fijo: 


5 
a h?+(3V/7) 
3r 
h=2? gr 2) 
TT 


Si r=1 m y V=0.5 m', determine si cualquiera de las dos alturas es 
estable, y el rango de valores iniciales para los que sí son estables. 
8.11 La operación de un reactor de flujo tipo tapón de densidad 
constante para la producción de una sustancia por una reacción en- 
zimática se describe mediante la ecuación que se muestra en seguida, 
donde V es el volumen del reactor, F' es el caudal del reactante C, Copy 
y C¿, son las concentraciones del reactante a la entrada y a la salida 
del reactor, respectivamente, y K y k,,¿, son constantes. Para un 
reactor de 100 L, con una concentración de entrada de C.,, = 0.2 M, 
un caudal de entrada de 80 L/s, Kn4, = 10? s7* y K=0.1 M, encuen- 
tre la concentración de C a la salida del reactor. 
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vo de K e 1 e 
Fo C Kmáx € 


ent 


8.12 La ecuación de Ergun, que se da más adelante, sirve para des- 
cribir el flujo de un líquido a través de un cauce comprimido. AP es 
la caída de presión, p es la densidad del fluido, G, es la velocidad 
másica (el cociente del flujo de masa dividido entre el área de la 
sección transversal), D, es el diámetro de las partículas dentro del 
cauce, u es la viscocidad del fluido, L es la longitud del cauce y € es 
la fracción vacía del cauce. 
3 
1 A 
E TEE 


A 
=> 

BE 

17 


Dados los siguientes valores para los parámetros encuentre la fracción 
vacía € del cauce. 


D,G, 
— =1000 
17 
APpD 
10 
G,L 


8.13 En una sección de tubo, la caída de presión se calcula así: 


.Lpv? 


Ap=f 2D 


donde Ap = caída de presión (Pa), f= factor de fricción, L = longitud 
del tubo [m], P = densidad (kg/m?), V = velocidad (m/s) y D = diá- 
metro (m). Para el flujo turbulento, la ecuación de Colebrook pro- 
porciona un medio para calcular el factor de fricción, 


E 20os| E. 1) 


17 3.7D "Ref 
donde € = rugosidad (m) y Re = número de Reynolds, 
Re = pya 
7 


donde UU = viscosidad dinámica (N - s/m?). 

a) Determine Ap para un tramo horizontal de tubo liso de 0.2m 
de longitud, dadas P = 1.23 kg/m, M=1.79x 10% N - s/m?, 
D=0.005 m, V= 40 m/s y € = 0.0015 mm. Utilice un método 
numérico para determinar el factor de fricción. Obsérvese que 
los tubos lisos tienen Re < 10%, un valor inicial apropiado se 
obtiene con el uso de la fórmula de Blasius, f=0.316/Re**. 

b) Repita el cálculo pero para un tubo de acero comercial más 
rugoso (€ = 0.045 mm). 


Ingeniería civil y ambiental 

8.14 En ingeniería estructural, la fórmula de la secante define la 
fuerza por unidad de área, P/A, que ocasiona la tensión máxima O, 
en una columna que tiene una razón de esbeltez L/k dada es: 


P m 
A  1+(ec/k?) sec [0.5 /PKEA)NLI/k)] 
donde ec/k? = razón de excentricidad y E = módulo de elasticidad. 


Si para una viga de acero, E = 200000 MPa, ec/k? = 0.2 y O, = 250 
MPa, calcule P/A para L/k = 100. Recuerde que sec x= 1/cos x. 


8.15 En la ingeniería ambiental (una especialidad de la ingeniería 
civil), la ecuación siguiente se emplea para calcular el nivel de oxí- 
geno c (mg/L) en un río aguas abajo de la descarga de un drenaje: 


c=10- 2000 _ en 


donde x es la distancia aguas abajo en kilómetros. 

a) Determine la distancia aguas abajo de la corriente, a la cual el 
nivel de oxígeno cae hasta una lectura de 5 mg/L. (Sugerencia: 
Está dentro de 2 km de la descarga.) Encuentre la respuesta con 
un error de 1%. Obsérvese que los niveles de oxígeno por debajo 
de 5 mg/L por lo general son dañinos para ciertas especies de 
pesca deportiva, como la trucha y el salmón. 

b) Calcule la distancia aguas abajo a la cual el oxígeno se encuentra 
al mínimo. ¿Cuál es la concentración en dicha ubicación? 
8.16 La concentración de bacterias contaminantes c en un lago 

disminuye de acuerdo con la ecuación 


c= 70e 1? dE 2560075: 


Determine el tiempo que se requiere para que la concentración de 
bacterias se reduzca a 9 con el uso de a) el método gráfico, y b) el 
método de Newton-Raphson, con un valor inicial de £= 10 y criterio 
de detención de 0.5%. Compruebe los resultados que obtenga. 

8.17 Un cable en forma catenaria es aquel que cuelga entre dos 
puntos que no se encuentran sobre la misma línea vertical. Como se 
ilustra en la figura P8.17a, no está sujeto a más carga que su propio 
peso. Así, su peso (N/m) actúa como una carga uniforme por unidad 
de longitud a lo largo del cable. En la figura P8.17b, se ilustra un 
diagrama de cuerpo libre de una sección AB, donde T, y Ty son las 
fuerzas de tensión en el extremo. Con base en los balances de fuerzas 
horizontal y vertical, se obtiene para el cable el siguiente modelo de 
ecuación diferencial: 


Puede emplearse el cálculo para resolver esta ecuación para la altura 
y del cable como función de la distancia x, 


W = ws 


b) 


Figura P8.17 

a) Fuerzas que actúan sobre una sección AB de un cable flexi- 
ble que cuelga. La carga es uniforme a lo largo del cable (pero 
no uniforme por la distancia horizontal x). b) Diagrama de 
cuerpo libre de la sección AB. 
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T T 
y== cosh E + y -É 
w T, w 


donde el coseno hiperbólico se calcula por medio de la ecuación: 
cosh x a (et+e”) 
=(e +e 
2 


Utilice un método para calcular un valor para el parámetro T, dados 
los valores de los parámetros w= 10 y y, = 5, de modo que el cable 
tenga una altura de y = 15 en x= 50. 

8.18 En la figura P8.18a se muestra una viga uniforme sujeta a una 
carga distribuida uniformemente que crece en forma lineal. La ecua- 
ción para la curva elástica resultante es la siguiente (véase la figura 
P8.18b) 


wo 


(+2 xx) 
120EIL 


y (P8.18.1) 


Utilice el método de la bisección para determinar el punto de máxima 
deflexión (es decir, el valor de x donde dy/dx = 0). Después, sustitu- 
ya este valor en la ecuación (P8.18.1) a fin de determinar el valor de 
la deflexión máxima. En sus cálculos, utilice los valores siguientes 


para los parámetros: L=450 cm, E= 50000 kN/cm?, 1= 30000 cm! 
y Wy= 1.75 kN/cm. 


777 77TP, 


b) 


Figura P8.18 


8.19 El desplazamiento de una estructura está definido por la ecua- 
ción siguiente para una oscilación amortiguada: 


y =8e* cos (wt 


donde k = 0.5 y W =3. 

a) Utilice el método gráfico para realizar una estimación inicial del 
tiempo que se requiere para que el desplazamiento disminuya 
ad. 

b) Emplee el método de Newton-Raphson para determinar la raíz 
con €, = 0.01%. 

c) Use el método de la secante para determinar la raíz con €, = 
0.01%. 


172 


8.20 La ecuación de Manning se puede escribir, para un canal rec- 
tangular abierto, como 


_ VSGHYY 


0= n(B+2Hy/3 


donde O = caudal [m/s], S = pendiente [m/m], A = profundidad [m] 
y n= coeficiente de rugosidad de Manning. Desarrolle un esquema 
de iteración de punto fijo para despejar H de esta ecuación, dados Q 
= 5, $ = 0.0002, B=20 y n= 0.03. Pruebe que su esquema converge 
para todos los valores iniciales mayores de cero o iguales a cero. 
8.21 En ingeniería oceanográfica, la ecuación de una ola estaciona- 
ria reflejada en un puerto está dada porÁ =16,1=12, v=48: 


27 2711tv a 
h=h, sen | ) vos )+e| 
| A A 


Resuelva para el valor positivo más bajo de x, si h =0.4 hp. 

8.22 Suponga el lector que compra una pieza de equipo en $20 000 
como pago inicial y $4000 por año durante 6 años. ¿Qué tasa de 
interés estaría pagando? La fórmula que relaciona el valor presente 
P, los pagos anuales A, el número de años n y la tasa de interés 1, es 
la que sigue: 


A 
2 (+1 


8.23 Muchos campos de la ingeniería requieren cálculos exactos de 
la población. Por ejemplo, los ingenieros de transporte quizás en- 
cuentren necesario determinar por separado la tendencia del creci- 
miento de una ciudad y la de los suburbios. La población del área 
urbana declina con el tiempo de acuerdo con la ecuación: 


E —Kyl 
P,(t) => Pimil + Pemán 


en tanto que la población suburbana crece según: 


Pa 
Pp f)= 5, máx 
dl E US 


5, MÁX 


donde Pimáo Kw Psmiwo Poy k, Son parámetros que se obtienen en 
forma empírica. Determine el tiempo y los valores correspondientes 
de P,(t) y P,(t) cuando los suburbios son 20% más grandes que la 
ciudad. Los valores de los parámetros son: P,, máx = 75000, K,,=0.045/ 
año, Po, mín = 100000 personas, P; nx = 300000 personas, Py = 10000 
personas, k,=0.08/año. Para obtener las soluciones utilice los méto- 
dos a) gráfico, b) de la falsa posición y c) de la secante modificada. 
8.24 En la figura P8.24 se muestra una viga apoyada en forma sen- 
cilla que está cargada como se ilustra. Con el empleo de funciones 


20 kips/ft 
150 kips-ft 15 kips 
LE, 
5' : 2 1 2 
Figura P8.24 
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de singularidad, el esfuerzo cortante a lo largo de la viga se expresa 
con la ecuación: 


V(x) = 20[(x — 0) — (x — 5] - 15(x — 8)? - 57 


Por definición, la función de singularidad se expresa del modo que 
sigue: 


(x = ay = E _ ay 


0 cuando x<a 


cuando x > 5 


Utilice un método numérico para encontrar el (los) punto(s) en los 
que el esfuerzo cortante sea igual a cero. 

8.25 Con el uso de la viga apoyada en forma simple del problema 
8.24, el momento a lo largo de ella, M(x), está dado por: 


MG) =-10[(x — 0)? — (x- 5] + 15(x - 8)! 
+ 150(x-— 7 + 57x 


Emplee un método numérico para encontrar el (los) punto(s) en los 
que el momento es igual a cero. 

8.26 Con el uso de la viga con apoyo simple del problema 8.24, la 
pendiente a lo largo de ella está dada por: 


du, _—10 A 31,15 2 
a [x—0)' (15/1418) 


+150(x—7)' + Ze - 238.25 
Utilice un método numérico para encontrar el (los) punto(s) donde 
la pendiente es igual a cero. 
8.27 Para la viga con apoyo simple del problema 8.24, el desplaza- 
miento a lo largo de ella está dado por la ecuación: 


uco= la 0) (ax Sp (1-8) 


E75(x ES 238.25x 


a) Calcule el (los) punto(s) donde el desplazamiento es igual a cero. 

b) ¿Cómo se usaría una técnica de localización de raíces para 
determinar la ubicación del desplazamiento mínimo? 

8.28 Aunque no lo mencionamos en la sección 8.2, la ecuación (8.10) 

realmente es una expresión de electroneutralidad; es decir, de que 

las cargas positivas y negativas se deben equilibrar. Esto se puede 

ver más claramente expresándola como 


[H*] = [HCO; ] + 2[C03] + [OH] 


En otras palabras, las cargas positivas deben igualar a las cargas ne- 
gativas. Entonces, cuando calcula el pH de un cuerpo de agua natural 
tal como un lago, usted debe tener en cuenta otros ¡ones que pueden 
estar presentes. Para el caso en el que estos jones tengan su origen 
en sales no reactivas, las cargas netas negativas menos positivas 
debidas a estos ¡ones se agrupan en una cantidad que se llama alca- 
linidad, y la ecuación se reformula como 


Alk + [H*] = [HCO3] + 2[C03 ] + [OH]  (P8.28.1) 


Donde Alk = alcalinidad (eq/L). Por ejemplo, la alcalinidad del Lago 
Superior es aproximadamente de 0.4 x 10 eq/L. Realice los mismos 
cálculos que en la sección 8.2 para calcular el pH del Lago Superior 
en 2008. Suponga que, igual que las gotas de lluvia, el lago está en 
equilibrio con el CO, atmosférico, pero tenga en cuenta la alcalinidad 
como en la ecuación (P8.28.1). 


Ingeniería eléctrica 

8.29 Ejecute el mismo cálculo que en la sección 8.3, pero determine 
el valor de L que se requiere para que el circuito disipe 1% de su 
valor original en £= 0.05 s, dado R = 280 Q y C= 10*F. Emplee a) 
un enfoque gráfico, b) la bisección y c) software para encontrar raíces, 
como Solver de Excel o la función £zero de MATLAB, o la raíz de 
la función de Mathcad. 

8.30 La ecuación ¡= 9e” sen (2781), describe una corriente oscilato- 
ria en un circuito eléctrico, donde f se expresa en segundos. Deter- 
mine todos los valores de £ de modo que ¡= 3.5. 

8.31 La resistividad p de un lubricante de sílice se basa en la carga 
q en un electrón, la densidad del electrón n y la movilidad del electrón 
1. La densidad del electrón está dada en términos de la densidad del 
lubricante N y la densidad intrínseca de acarreo n;. La movilidad del 
electrón está descrita por la temperatura T, la temperatura de referen- 
cia T, y la movilidad de referencia uy. Las ecuaciones que se requie- 
ren para calcular la resistividad son las siguientes: 


donde 


2.42 
n= (N+/N +4?) y 0 (E) 


Determine N, dado que T, = 300 K, T= 1000 K, y = 1300 cm? 
(Vs), q=1.6x 10? C, n,=6.21 x 10 cm” y un valor deseable de 
p=6x 10% V s cm/C. Use los métodos a) bisección y b) la secante 
modificada. 
8.32 Una carga total O se encuentra distribuida en forma uniforme 
alrededor de un conductor en forma de anillo con radio a. Una carga 
q se localiza a una distancia x del centro del anillo (véase la figura 
P8.32). La fuerza que el anillo ejerce sobre la carga está dada por la 
ecuación 
ol q0x 
Ame, (1 +a?y” 
donde e, = 8.85 x 10? C?/(N m?). Encuentre la distancia x donde la 
fuerza es de 1 N, si q y Q son 2 x 107 C para un anillo con un radio 
de 0.9 m. 


Q 


Figura P8.32 


8.33 En la figura P8.33 se muestra un circuito con una resistencia, 
un inductor y un capacitor en paralelo. Para expresar la impedancia 
del sistema se emplean las leyes de Kirchhoff, así: 


1 1 1 y 
= > + (uc ) 
Z R” OL 
donde Z= impedancia ((2) y (Y = frecuencia angular. Encuentre la (y 
que da como resultado una impedancia de 75 (2, con el uso tanto del 
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método de la bisección como el de la falsa posición, con valores 
iniciales de 1 y 1000 y los parámetros siguientes: R=225 (2, C=0.6 
x 10% F y L=0.5 H. Determine cuántas iteraciones son necesarias 
con cada técnica a fin de encontrar la respuesta con €, = 0.1%. Uti- 
lice el enfoque gráfico para explicar cualesquiera dificultades que 
surjan. 


Y) R 


Figura P8.33 


Ingeniería mecánica y aeroespacial 

8.34 Más allá de la ecuación de Colebrook, hay disponibles otras 
relaciones como el factor de fricción de Fanning f para estimar la 
fricción en tubos. El factor de fricción de Fanning depende de cierto 
número de parámetros relacionados con el tamaño del tubo y el 
fluido, que pueden representarse con otra cantidad adimensional, el 
número de Reynolds Re. Una fórmula que pronostica el valor de f 
dado Re es la ecuación de Von Karman. 


Ari =4 log) (Rey/f)-0.4 


Valores comunes del número de Reynolds para flujo turbulento son 
10000 a 500000, y del factor de fricción de Fanning son 0.001 a 0.01. 
Desarrolle una función que utilice el método de bisección con obje- 
to de resolver cuál sería el factor de fricción de Fanning f, dado un 
valor de Re proporcionado por el usuario que esté entre 2500 y 
1000000. Diseñe la función de modo que se garantice que el error 
absoluto en el resultado sea de E, ¿ < 0.000005. 

8.35 Los sistemas mecánicos reales involucran la deflexión de re- 
sortes no lineales. En la figura P8.35 se ilustra una masa m que se 
libera por una distancia h sobre un resorte no lineal. La fuerza de 
resistencia F del resorte está dada por la ecuación 


F=-(k,d + kad*?) 
Es posible usar la conservación de la energía para demostrar que 


5/2 
Es 5d mgd — mgh 


Despeje d, dados los siguientes valores de parámetros: k, = 40 000 
g/s?, k, = 40 g/l(s* m5), m=95 g, g=9.81 m/s? y h=0.43 m. 


0 


Figura P8.35 
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8.36 Los ingenieros mecánicos, así como los de otras especialidades, 
utilizan mucho la termodinámica para realizar su trabajo. El siguien- 
te polinomio se emplea para relacionar el calor específico a presión 
cero del aire seco, c, kJ/(kg K), a temperatura (K): 


€, = 0.99403 + 1.671 x 10*T+ 9.7215 x 10*T? 
9.5838 x 1017? + 1.9520 x 101*7* 


Determine la temperatura que corresponda a un calor específico de 
1.2 kJ/(kg K). 

8.37 En ciertas ocasiones, los ingenieros aeroespaciales deben cal- 
cular las trayectorias de proyectiles, como cohetes. Un problema 
parecido tiene que ver con la trayectoria de una pelota que se lanza. 
Dicha trayectoria está definida por las coordenadas (x, y), como se 
ilustra en la figura P8.37. La trayectoria se modela con la ecuación 


g A x +0 


= (tan 0): - =*>7 
PO 2v; cos” O, 


Calcule el ángulo inicial 0, apropiado si la velocidad inicial v, = 20 m/s 
y la distancia x al catcher es de 40 m. Obsérvese que la pelota sale de la 
mano del lanzador con una elevación yy = 1.8m, y el catcher la recibe a 
1 m. Exprese el resultado final en grados. Para g, utilice un valor de 9.81 
m/s”, y emplee el método gráfico para elegir valores iniciales. 


YA 


Figura P8.37 


8.38 La forma general para un campo tensorial de tres dimensiones 
es la siguiente: 


O O, O, 
O, 0, 0, 
O, 0, 0 


en la que los términos en la diagonal principal representan esfuerzos 
a la tensión o a la compresión, y los términos fuera de la diagonal 
representan los esfuerzos cortantes. Un campo tensorial (en MPa) 
está dado por la matriz que sigue: 


10 14 25 
14 7 15 
25 15 16 


Para resolver cuáles son los esfuerzos principales, es necesario cons- 
truir la matriz siguiente (de nuevo en MPa): 


l0-o 14 25 
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O, O, y Oy se obtienen con la ecuación 
o*-lo" +Hl0-HI=0 
donde 


I=0.,, +0,, +0, 


H == O ol y + O, 0 o. + 0,0 2 E ojal NN o. NN o. 


xx" yy 


ll=0,,0,0,,—0,,0,,- 0,0, 


xx yy xx yz yy 


0,0, +20,,0,0., 


L IT y HI se conocen como las invariantes de esfuerzos. Encuentre O, 
O, y O por medio de una técnica de localización de raíces. 

8.39 La velocidad vertical de un cohete se calcula con la fórmula 
que sigue: 


donde v = velocidad vertical, u = velocidad con la que se expele el 
combustible, en relación con el cohete, m, = masa inicial del cohete 
en el momento f = 0, q = tasa de consumo de combustible y g = 
aceleración de la gravedad hacia abajo (se supone constante e igual 
a 9.81 m/s”). Si u = 2200 m/s, my = 160000 kg y q = 2680 kg/Ss, 
calcule el momento en que v= 1000 m/s. (Sugerencia: El valor de £ 
se encuentra entre 10 y 50 s.) Calcule el resultado de modo que esté 
dentro de 1% del valor verdadero. Compruebe su respuesta. 

8.40 El ángulo de fase ( entre la vibración forzada que ocasiona el 
camino rugoso y el movimiento del carro, está dada por la ecuación: 


_ 2(c/c Xw/p) 


tan 
? 1-(0/pyY 


Como ingeniero mecánico, le gustaría saber si existen casos en que 
Q = 0/2 — 1. Utilice los otros parámetros de la sección con objeto de 
plantear la ecuación como un problema de cálculo de raíces, y re- 
suélvala para (1. 

8.41 Se mezclan dos fluidos con temperatura diferente de modo que 
alcanzan la misma temperatura. La capacidad calorífica del fluido A 
está dada por: 


€) = 3.381 + 1.804 x 107 — 4.300 x 10% 7? 
y la capacidad calorífica del fluido B se obtiene con: 
€) = 8.592 + 1.290 x 10T- 4.078 x 107 T? 


donde c,, se expresa en unidades de cal/mol K, y T está en unidades 
de K. Obsérvese que 


AH = [7 c,dT 


El fluido A entra al mezclador a 400%C, y el B a 600%C. Al entrar al 
mezclador hay lo doble de fluido A que B. ¿A qué temperatura salen 
los dos fluidos del mezclador? 

8.42 Un compresor opera a una razón de compresión R, de 3.0 (esto 
significa que la presión del gas en la salida es tres veces mayor que 
en la entrada). Los requerimientos de energía del compresor H,, se 
determinan por medio de la ecuación que se da a continuación. 
Suponga que los requerimientos de energía del compresor son exac- 
tamente iguales a ZRT¡/MW, y encuentre la eficiencia politrópica n 
del compresor. El parámetro z es la compresibilidad del gas en las 
condiciones de operación del compresor, R es la constante de los 
gases, T, es la temperatura del gas en la entrada del compresor y 
MW es el peso molecular del gas. 


E 

—MWn-1 
8.43 En los envases térmicos que se ilustran en la figura P8.43, el 
compartimiento interior está separado del medio por medio de 
vacío. Hay una cubierta exterior alrededor de los envases. Esta 
cubierta está separada de la capa media por una capa delgada de 
aire. La superficie de afuera de la cubierta exterior está en contac- 
to con el aire del ambiente. La transferencia de calor del compar- 
timiento interior a la capa siguiente q, sólo ocurre por radiación 
(ya que el espacio se encuentra vacío). La transferencia de calor 
entre la capa media y la cubierta exterior q, es por convección en 
un espacio pequeño. La transferencia de calor de la cubierta exte- 
rior hacia el aire qgz sucede por convección natural. El flujo de 
calor desde cada región de los envases debe ser igual, es decir, q, 
= q, = 93. Encuentre las temperaturas T, y T, en estado estable. T,, 
es de 500*C y T, = 25*C. 


Roy 1) 


e 


q, =10"[(T, +273)' -(T,+273)*] 
q) =4T,-T,) 
q)= 137, - TP 


Figura P8.43 


8.44 La figura P8.44 ilustra tres almacenamientos conectados por 
medio de tubos circulares. Los tubos están hechos de hierro fundido 
recubierto con asfalto (e = 0.0012 m), y tienen las características 
siguientes: 


Tubo 1 2 3 
Longitud, m 1800 500 1400 
Diámetro, m 0.4 0.25 0.2 
Flujo, m*/s ? 0.1 ? 


Figura P8.44 
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Si las elevaciones de la superficie del agua en los almacenamientos 
A y C son de 200 m y 172.5 m, respectivamente, determine la eleva- 
ción que alcanza en el almacenamiento B y los flujos en los tubos 1 
y 3. Obsérvese que la viscosidad cinemática del agua es de 1 x 107% 
m/?/s, y utilice la ecuación de Colebrook para obtener el factor de 
fricción (consulte el problema 8.13). 

8.45 Un fluido se bombea en la red de tubos que se muestra en la 
figura P8.45. En estado estacionario, se cumplen los balances de 
flujo siguientes: 


Q,=0,+0, 
0,=0,+0, 
0,=0,+0, 


donde O, = flujo en el tubo i [m/s]. Además, la caída de presión al- 
rededor de los tres lazos en los que el flujo es hacia la derecha debe 
ser igual a cero. La caída de presión en cada tramo de tubo circular 
se calcula por medio de la ecuación: 


_16 fLp 


mm 2D? 2 


donde AP = caída de presión (Pa), f= factor de fricción (adimensio- 
nal), L= longitud del tubo (m), p = densidad del fluido (kg/m?) y D 
= diámetro del tubo (m). Escriba un programa (o desarrolle un algo- 
ritmo en algún paquete de software de matemáticas) que permita 
calcular el flujo en cada tramo de tubo, dado que Q, = 1m//s y p = 
1.23 kg/m. Todos los tubos tienen D = 500 mm y f = 0.005. Las 
longitudes de los tubos son: £z= L;=L¿=Ly=2 m; L,= L,¿ = L¿= 
4m,yL,=8m. 


Figura P8.45 


8.46 Repita el problema 8.45, pero incorpore el hecho de que el 
factor de fricción se calcula con la ecuación de Von Karman, que es: 


1 


_. 4log,,(Re/f )-0.4 


donde Re = número de Reynolds 


donde V = velocidad del fluido en el tubo (m/s) y uu = viscosidad 
dinámica (N-s/m?). Obsérvese que para un tubo circular, V=40/ 
TTD”. Asimismo, suponga que el fluido tiene una viscosidad de 1.79 
x 10% N-s/m?. 

8.47 Sobre el transbordador espacial, al despegar de la plataforma, 
actúan cuatro fuerzas, las que se muestran en el diagrama de cuerpo 
libre (véase la figura P8.47). El peso combinado de los dos cohetes 
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de combustible sólido y del tanque exterior de éste, es de W¿= 1.663 
x 10% Ib. El peso del orbitador con carga completa es de Wy=0.23 x 
10% lb. El empuje combinado de los dos cohetes de combustible só- 
lido es Tz = 5.30 x 10% Ib. El empuje combinado de los tres motores 
de combustible líquido del orbitador es de T;= 1.125 x 10% lb. 

Al despegar, el empuje del motor del orbitador se dirige con un 
ángulo 0 para hacer que el momento resultante que actúa sobre el 
conjunto de la nave (tanque exterior, cohetes de combustible sólido 
y orbitador) sea igual a cero. Con el momento resultante igual a cero, 
la nave no giraría sobre su centro de gravedad G al despegar. Con 
estas fuerzas, la nave experimentará una fuerza resultante con com- 
ponentes en dirección vertical y horizontal. La componente vertical 
de la fuerza resultante, es la que permite que la nave despegue de 
la plataforma y vuele verticalmente. La componente horizontal de la 
fuerza resultante hace que la nave vuele en forma horizontal. El 
momento resultante que actúa sobre la nave será igual a cero cuando 
0 se ajusta al valor apropiado. Si este ángulo no se ajusta en forma 
adecuada y hubiera algún momento que actuara sobre la nave, ésta 
tendería a girar alrededor de su centro de gravedad. 

a) Resuelva el empuje del orbitador Ten las componentes horizon- 
tal y vertical, y después sume los momentos respecto del punto 


L—28' —! 
A A 


Tanque externo 


: Cohete de 
combustible 
sólido 


' Orbitador 


o-3|--.-- ¡PARRA 
G 
38" 
W, 


B p Ws 


| 
| 
| 
Ts 
Ty 
0 


Figura P8.47 


Capítulo 8 Estudio de casos: raíces de ecuaciones 


G, centro de gravedad de la nave. Iguale a cero la ecuación del 
momento resultante. Ahora, ésta puede resolverse para el valor 
de O que se requiere durante el despegue. 

b) Obtenga una ecuación para el momento resultante que actúa 
sobre la nave en términos del ángulo 6. Grafique el momento 
resultante como función del ángulo 0 en el rango de -5 radianes 
a +5 radianes. 

c) Escriba un programa de computadora para resolver para el ángulo 
0 por medio del método de Newton para encontrar la raíz de la 
ecuación del momento resultante. Con el empleo de la gráfica, 
elija un valor inicial para la raíz de interés. Interrumpa las 
iteraciones cuando el valor de O ya no mejore con cinco cifras 
significativas. 

d) Repita el programa para el peso de la carga mínima del orbitador, 
que es W;= 195000 lb. 

8.48 Determinar la velocidad de partículas que se sedimentan a 

través de un fluido es de gran importancia en muchas áreas de la 

ingeniería y de la ciencia. Tales cálculos dependen del régimen de 
flujo representado por el número de Reynolds, adimensional, 


pdv 
p 


Re (P8.48.1) 
donde p = densidad del fluido (kg/m”), d = diámetro de la partícula 
(m), v = velocidad de sedimentación de la partícula (m/s) y U = 
viscosidad dinámica del fluido (Ns/m?). En condiciones de flujo la- 
minar (Re < 0.1), la velocidad de sedimentación de una partícula 
esférica se puede calcular con la siguiente fórmula basada en la ley 
de Stokes: 


E 
18 pp 


donde g = constante gravitacional (= 9.81 m/s?) y p, = densidad de 
la partícula (kg/m*). Para condiciones de flujo turbulento (es decir, 
números de Reynolds mayores), se puede usar un procedimiento 
alternativo basado en la siguiente fórmula: 


y =.J4t0:= 0d 
3Cpp 
donde C, = coeficiente de arrastre, que depende del número de Re- 
ynolds, como en 


(P8.48.2) 


(P8.48.3) 


(P8.48.4) 


a) Combine las ecuaciones (P8.48.2), (P8.48.3) y (P8.48.4) para 
expresar la determinación de v como una raíz de las ecuaciones 
del problema. Es decir, exprese la fórmula combinada en el 
formato fv) = 0. 

b) Use el método de secante modificada con Ó = 107 y €,=0.05% 
para determinar v para una partícula esférica de hierro sedimen- 
tándose en agua, donde d = 200 um, p =1 g/cmY, Ps=7.874 
g/cm? y u = 0.014 g/(cm:s). Utilice la ecuación (P8.48.2) para 
generar su valor inicial. 

c) Con base en el resultado de b), calcule el número de Reynolds y 
el coeficiente de arrastre, y use este último para confirmar que el 
régimen de flujo no es laminar. 

d) Desarrolle una solución con iteración de punto fijo para las 
condiciones descritas en b). 

e) Use un procedimiento gráfico para ilustrar que la formulación 
desarrollada en d) convergirá para cualquier valor positivo. 


EPÍLOGO: PARTE DOS 


PT2.4 ALTERNATIVAS 


La tabla PT2.3 proporciona un resumen de las alternativas para la solución de las raíces de ecuacio- 
nes algebraicas y trascendentes. Aunque los métodos gráficos consumen tiempo, ofrecen cierto 
conocimiento sobre el comportamiento de la función y son útiles para identificar valores iniciales y 
problemas potenciales como el de las raíces múltiples. Por lo tanto, si el tiempo lo permite, un bos- 
quejo rápido (o mejor aún, una gráfica computarizada) brindará información valiosa sobre el com- 
portamiento de la función. 

Los métodos numéricos se dividen en dos grandes categorías: métodos cerrados y abiertos. Los 
primeros requieren dos valores iniciales que estén a ambos lados de la raíz, para acotarla. Este 
“acotamiento” se mantiene en tanto se aproxima a la solución; así, dichas técnicas son siempre con- 
vergentes. Sin embargo, se debe pagar un precio por esta propiedad, la velocidad de convergencia es 
relativamente lenta. 

Las técnicas abiertas difieren de los métodos cerrados inicialmente en que usan la información 
de un solo punto (o dos valores que no necesitan acotar a la raíz para extrapolar a una nueva aproxi- 
mación de la misma). Esta propiedad es una espada de dos filos. Aunque llevan a una rápida con- 
vergencia, existe la posibilidad de que la solución diverja. En general, la convergencia con técnicas 
abiertas es parcialmente dependiente de la calidad del valor inicial y de la naturaleza de la función. 
Cuanto más cerca esté el valor inicial de la raíz verdadera, los métodos convergerán más rápido. 

De las técnicas abiertas, el método estándar de Newton-Raphson se utiliza con frecuencia por 
su propiedad de convergencia cuadrática. Sin embargo, su mayor deficiencia es que requiere que la 
derivada de la función se obtenga en forma analítica. Con algunas funciones se vuelve impráctico. 


Tabla PT2.3 Comparación de las características de los métodos alternativos para encontrar raíces de ecuaciones 
algebraicas y trascendentes. Las comparaciones se basan en la experiencia general y no toman en 


cuenta el comportamiento de funciones específicas. 


Método Tipo Valores Convergencia Estabilidad Programación Comentarios 
Directo Analítico — = = 
Gráfico Visual = — =— = Impreciso 
Bisección Cerrado 2 Lenta Siempre Fácil 
Falsa posición Cerrado 2 Lenta/media Siempre Fácil 
PF modificada Cerrado 2 edia Siempre Fácil 
teración punto Abierto 1 Lenta Posiblemente Fácil 
fijo divergente 
Newton-Raphson Abierto 1 Rápida Posiblemente Fácil Necesita evalua- 
divergente ción de F(x) 
Newton-Raphson Abierto 1 Rápida (múltiple), Posiblemente Fácil Necesita evalua- 
modificado media (única) divergente ción de F(x) y 
Fx) 
Secante Abierto 2 ediana/rápida Posiblemente Fácil Condiciones ini- 
divergente Ciales no tienen 
que abarcar la 
raíz 
Secante modifi- Abierto 1 Media/rápida Posiblemente Fácil Robusto 
cado divergente 
Brent Híbrido 102 Media Siempre (para 2 oderada 
condiciones) 
Múller Polinomios 2 Media/rápida Posiblemente oderada 
divergente 
Bairstow Polinomios 2 Rápida Posiblemente oderada 
SEE 
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Epílogo: parte dos 


En dichos casos, el método de la secante, que emplea una representación en diferencias finitas de 
la derivada, proporciona una alternativa viable. Debido a la aproximación en diferencias finitas, la 
velocidad de convergencia del método de la secante es al principio más lento que el método de 
Newton-Raphson. Sin embargo, conforme se refina la estimación de la raíz, la aproximación por 
diferencias se vuelve una mejor representación de la derivada verdadera y, en consecuencia, se ace- 
lera rápidamente la convergencia. Se puede usar la técnica modificada de Newton-Raphson y así 
obtener una rápida convergencia para raíces múltiples. Sin embargo, dicha técnica requiere una ex- 
presión analítica tanto para la primera como para la segunda derivada. 

Son especialmente interesantes los métodos híbridos que combinan la confiabilidad del acota- 
miento con la rapidez de los métodos abiertos. El método de Brent hace esto combinando la bisección 
con diversos métodos abiertos. Todos los métodos numéricos son fáciles de programar en compu- 
tadoras y requieren de un tiempo mínimo para determinar una sola raíz. Sobre esta base, usted podría 
concluir que los métodos simples como el de bisección resultarían suficientemente buenos para fines 
prácticos. Lo anterior será cierto si usted se interesa exclusivamente en determinar sólo una vez la 
raíz de una ecuación. Pero hay muchos casos en ingeniería donde se requiere la localización de 
muchas raíces y donde la rapidez se vuelve importante. En tales casos, los métodos lentos consumen 
mucho tiempo y son por lo tanto costosos. Por otro lado, los métodos abiertos (más rápidos) pueden 
llegar a diverger, y los retardos que esto implica pueden también ser costosos. Algunos algoritmos 
de cómputo intentan conjugar las ventajas de ambas técnicas, al emplear inicialmente un método 
cerrado para aproximar la raíz, y después cambiar a un método abierto que mejore la estimación con 
rapidez. Ya sea que se utilice un solo procedimiento o una combinación, la búsqueda de convergen- 
cia y velocidad es fundamental para la elección de una técnica de localización de raíces. 


PT2.5 RELACIONES Y FÓRMULAS IMPORTANTES 


La tabla PT2.4 resume la información importante que se presentó en la parte dos. Dicha tabla se 
puede consultar para un acceso rápido de relaciones y fórmulas importantes. 


PT2.6 MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES 


En el presente texto los métodos se han concentrado en determinar una sola raíz real de una ecuación 
algebraica o trascendente, considerando un conocimiento previo de su localización aproximada. 
Además, se han descrito también métodos que se hallan expresamente diseñados para determinar 
las raíces reales y complejas de polinomios. Referencias adicionales sobre el tema son Ralston y 
Rabinowitz (1978) y Carnahan, Luther y Wilkes (1969). 

Además de los métodos de Miller y de Bairstow, existen varias técnicas disponibles para de- 
terminar todas las raíces de polinomios. En particular, el algoritmo de diferencia del cociente (OD) 
(Henrici, 1964, y Gerald y Wheatley, 2004) determina todas las raíces sin tener valores iniciales. 
Ralston y Rabinowitz (1978) y Carnahan, Luther y Wilkes (1969) contienen un análisis de este mé- 
todo, así como de otras técnicas para la localización de raíces de polinomios. Como se analiza en el 
texto, los métodos de Jenkins-Traub y de Laguerre son de uso frecuente. 

En resumen, lo anterior lleva la intención de proporcionarle nuevos caminos para una exploración 
más profunda del tema. Además, todas las referencias anteriores ofrecen descripciones de las técni- 
cas básicas cubiertas en la parte dos. Le recomendamos que consulte esas fuentes alternativas con 
el objetivo de ampliar su comprensión de los métodos numéricos para la localización de raíces.' 


| Aquí sólo se menciona el autor de los libros citados. Se puede encontrar una bibliografía completa al final de este texto. 
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Tabla PT2.4 Resumen de información importante presentada en la parte dos. 


Interpretación Errores y criterios 
Método Formulación gráfica de terminación 


Métodos cerrados: 


_X FX, fa 
a da Raíz or A 
Bisección 2 0 a Criterio de terminación: 
Si Ax) Rx) < O, Xu =Xr Xx L Xu X xruevo — anterior 
EXxpÍx,) > 0, X=; o 1 — 100% < e, 
L/2 ij 
O 
L/4 
(o) A 
e á Fx MX) —X4,) f 
Falsa posición Fx) Ax,) Criterio de terminación: 
Si Exp Ax) < 0, Xy=X, xo uevo — yenterior 
EXxpFx,) > 0, x,=%; 1 100% < e, 
» X; 
Xx 
0) 4 
Tangente — 
Newton-Raphson Criterio de terminación: 
o A Ae 
no FO) ta 100% < e, 
% Xi41 
Error: Ej, ¡ = 0(£%) 
JA 
Secante Criterio de terminación: 
o PDA Xi) 
Ax) Fx) Ñ fi014400% < e, 
Xx +1 


PARTE TRES 


ECUACIONES ALGEBRAICAS 
LINEALES 


PT3.1 MOTIVACIÓN 


En la parte dos, determinamos el valor de x que satisface una única ecuación, f(x) = 0. Ahora, nos 
ocuparemos de determinar los valores x;, x>, ..., x, que en forma simultánea satisfacen un sistema 
de ecuaciones 


$1 (tj Xa, --.,x,)=0 
$ Oj, Xa, --.,x,)=0 


Í, (1, Mar... Xn) = 0 


Tales sistemas pueden ser lineales o no lineales. En la parte tres, trataremos con ecuaciones alge- 
braicas lineales, que tienen la forma general 


Ap X] + 019X7 + + 41, X, =D, 
07X] + 099X2 + + + Ma) X, = b) 
(PT3.1) 


Ap1X] + Qy9X3 4 + + AppX = b,, 


donde las a son los coeficientes constantes, las b son constantes y n es el número de ecuaciones. 
Todas las demás ecuaciones son no lineales. Los sistemas no lineales se analizaron en el capítulo 6, 
aunque se volverán a estudiar brevemente en el capítulo 9. 


PT3.1.1 Métodos sin computadora para resolver sistemas de ecuaciones 


Si son pocas ecuaciones (n = 3), las ecuaciones lineales (y algunas veces las no lineales) pueden 
resolverse con rapidez mediante técnicas simples. Algunos de estos métodos se revisarán al inicio 
del capítulo 9. Sin embargo, con cuatro o más ecuaciones, la solución se vuelve laboriosa y debe 
usarse una computadora. Históricamente, la incapacidad para resolver a mano los sistemas de ecua- 
ciones más grandes ha limitado el alcance de problemas por resolver en muchas aplicaciones de 
ingeniería. 

Antes de las computadoras, las técnicas para resolver ecuaciones algebraicas lineales consumían 
mucho tiempo y eran poco prácticas. Esos procedimientos restringieron la creatividad debido a que 
con frecuencia los métodos eran difíciles de implementar y entender. Como resultado, las técnicas 
se sobreenfatizaron, a expensas de otros aspectos del proceso de solución de problemas como la 
formulación y la interpretación (recuerde la figura PT1.1 y el análisis respectivo). 

El surgimiento de las computadoras fácilmente accesibles hizo posible y práctico resolver gran- 
des sistemas de ecuaciones algebraicas lineales simultáneas. Así, puede enfrentar ejemplos y pro- 
blemas más complicados. Además, cuenta con más tiempo para usar sus habilidades creativas, ya 
que pondrá mayor énfasis en la formulación del problema y en la interpretación de la solución. 
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Parte 3 Ecuaciones algebraicas lineales 


PT3.1.2 Ecuaciones algebraicas lineales y la práctica en ingeniería 


Muchas de las ecuaciones fundamentales en ingeniería se basan en las leyes de conservación (re- 
cuerde la tabla 1.1). Entre algunas cantidades conocidas que se someten a tales leyes están la masa, 
la energía y el momentum. En términos matemáticos, estos principios nos conducen a ecuaciones de 
balance o de continuidad que relacionan el comportamiento del sistema, al representarlo por los 
niveles o respuesta de la cantidad que se modela con las propiedades o características del sistema, 
y por los estímulos externos o funciones forzadas que actúan sobre el sistema. 

Por ejemplo, el principio de conservación de la masa se utiliza para formular un modelo de una 
serie de reactores químicos (figura PT3.1a). En este caso, la cantidad que habrá de modelarse es la 
masa de las sustancias químicas en cada reactor. Las propiedades del sistema son la reacción carac- 
terística de la sustancia química, los tamaños de los reactores y las velocidades de flujo. Las funcio- 
nes forzadas son las velocidades de suministro de las sustancias químicas hacia el sistema. 

En la parte dos, usted observó cómo sistemas de un solo componente dan por resultado una sola 
ecuación que puede resolverse mediante técnicas de localización de raíces. Los sistemas con multi- 
componentes resultan en un sistema de ecuaciones matemáticas que deben resolverse de manera 
simultánea. Las ecuaciones están relacionadas, ya que las distintas partes del sistema están influen- 
ciadas por otras partes. Por ejemplo, en la figura PT3.1a, el reactor 4 recibe sustancias químicas de 
los reactores 2 y 3. En consecuencia, su respuesta depende de la cantidad de sustancias químicas en 
esos reactores. 

Cuando esas dependencias se expresan matemáticamente, las ecuaciones resultantes a menudo 
son de forma algebraica y lineal, como la ecuación (PT3.1). Las x son medidas de las magnitudes de 
las respuestas de los componentes individuales. Al usar la figura PT3.1a como ejemplo, x, podría 
cuantificar la cantidad de masa en el primer reactor, x, cuantificaría la cantidad en el segundo, y así 
sucesivamente. Las a representan comúnmente las propiedades y características relacionadas con 
las interacciones entre los componentes. Por ejemplo, las a en la figura PT3.1a reflejarían las velo- 
cidades de masa entre los reactores. Por último, las b representan las funciones forzadas que actúan 
sobre el sistema, como la velocidad de alimentación en la figura PT3.1a. Las aplicaciones en el ca- 
pítulo 12 proporcionan otros ejemplos de tales ecuaciones obtenidas de la práctica de la ingeniería. 

Problemas de multicomponentes de los tipos anteriores surgen tanto de modelos matemáticos 
de variables agrupadas (macro) como distribuidas (micro) (figura PT3.1). Los problemas de varia- 
bles agrupadas involucran componentes finitos relacionadas. Entre los ejemplos se encuentran es- 
tructuras (sección 12.2), reactores (figura PT3.1a y sección 12.1) y circuitos eléctricos (sección 12.3). 
Estos tipos de problemas utilizan modelos que ofrecen poco o ningún detalle espacial. 

En cambio, los problemas con variables distribuidas intentan describir detalles espaciales de los 
sistemas sobre una base continua o semicontinua. La distribución de sustancias químicas a lo largo 
de un reactor rectangular alargado (figura PT3.1b) es un ejemplo de un modelo de variable continua. 

Las ecuaciones diferenciales obtenidas a partir de las leyes de 
conservación especifican la distribución de la variable dependien- 
| | te para tales sistemas. Esas ecuaciones diferenciales pueden re- 
solverse numéricamente al convertirlas en un sistema equivalente 


CIÓN ] | de ecuaciones algebraicas simultáneas. La solución de tales siste- 


mas de ecuaciones representa una importante área de aplicación 
a la ingeniería de los métodos en los siguientes capítulos. Esas 
La) Lu) ecuaciones están relacionadas, ya que las variables en una posición 
son dependientes de las variables en regiones adyacentes. Por 


Alimentación - x, 


E , ejemplo, la concentración en la mitad del reactor es una función 
de la concentración en regiones adyacentes. Ejemplos similares 


Figura PT3.1 


b) podrían desarrollarse para la distribución espacial de la tempera- 
tura o del momentum. Más adelante, abordaremos tales problemas 
cuando analicemos ecuaciones diferenciales. 


Dos tipos de sistemas que se modelan mediante ecuacio- Además de sistemas físicos, las ecuaciones algebraicas linea- 
nes algebraicas lineales. a) sistemas de variables agrupadas les simultáneas surgen también en diferentes contextos de proble- 
que involucran componentes finitos relacionados y b) siste-.. mas matemáticos. Estos resultan cuando se requiere de funciones 
mas de variables distribuidas que involucran un continuo. matemáticas que satisfagan varias condiciones en forma simultá- 


nea. Cada condición resulta en una ecuación que contiene coefi- 


PT3.2 Antecedentes matemáticos 


cientes conocidos y variables desconocidas. Las técnicas analizadas en esta parte sirven para 
encontrar las incógnitas cuando las ecuaciones son lineales y algebraicas. Algunas técnicas numé- 
ricas de uso general que emplean ecuaciones simultáneas son el análisis de regresión (capítulo 17) 
y la interpolación por trazadores (splines) (capítulo 18). 


PT3.2 ANTECEDENTES MATEMÁTICOS 


Todas las partes de este libro requieren de algunos conocimientos matemáticos. Para la parte tres, 
el álgebra y la notación matricial son útiles, ya que proporcionan una forma concisa para representar 
y manejar ecuaciones algebraicas lineales. Si usted ya está familiarizado con las matrices, quizá le 
convenga pasar a la sección PT3.3. Para quienes no tengan un conocimiento previo o necesiten un 
repaso, el siguiente material ofrece una breve introducción al tema. 


PT3.2.1 Notación matricial 


Una matriz consiste en un arreglo rectangular de elementos representado por 


un solo símbolo. Como se ilustra en la figura PT3.2, [4] es la notación breve Columna 3 
para la matriz y a, designa un elemento individual de la matriz. 4, A, 4, 
Un conjunto horizontal de elementos se llama un renglón (o fila); y uno AC A. 


vertical, columna. El primer subíndice ¡ siempre designa el número del renglón 


en el cual está el elemento. El segundo subíndice j designa la columna. Por [4]= 
ejemplo, el elemento a, está en el renglón 2 y la columna 3. 
La matriz en la figura PT3.2 tiene n renglones y m columnas, y se dice 
que tiene una dimensión (o tamaño) de n por m (o n xm). Ésta se conoce como OS 
una matriz n por m. 
Matrices con dimensión de renglón n = 1, tales como Figura PT3.2 
Una matriz. 


[B] = [b, b, NÉ Di] 


se les conoce como vectores renglón. Observe que para simplificar se elimina 
el primer subíndice de cada elemento. También, debe mencionarse que hay 
ocasiones en las que se requiere emplear una notación breve especial para distinguir una matriz 
renglón de otros tipos de matrices. Una forma para llevar a cabo esto es mediante el uso de corche- 
tes abiertos en la parte superior, así Lal. 

Las matrices con dimensión de columna m= 1, tales como 


Le, ] 


se conocen como vectores columna. Para simplificar, se elimina el segundo subíndice. Como en el 
caso del vector renglón, en ocasiones se desea emplear una notación breve especial para distinguir 
una matriz columna de otros tipos de matrices. Una forma para realizarlo consiste en emplear pa- 
réntesis de llave, así [C). 

A las matrices en las que n = m se les llama matrices cuadradas. Por ejemplo, una matriz de 4 
por 4 es 


41 4) 


da Az Aj la 
[4]= 


dz Az dz Az 


la Ay lag la 


Ann 
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A la diagonal que contiene los elementos a;;, 47, 433 Y 444 Se le llama diagonal principal de la matriz. 

Las matrices cuadradas resultan particularmente importantes cuando se resuelven sistemas de 
ecuaciones lineales simultáneas. En tales sistemas, el número de ecuaciones (que corresponde a los 
renglones) y el número de incógnitas (que corresponde a las columnas) debe ser igual para que sea 
posible tener una solución única. En consecuencia, cuando se trabaja con tales sistemas se tienen 
matrices cuadradas de coeficientes. Algunos tipos especiales de matrices cuadradas se describen en 
el cuadro PT3.1. 


PT3.2.2 Reglas de operaciones con matrices 


Ahora que ya especificamos el significado de una matriz, podemos definir algunas reglas de opera- 
ción que rigen su uso. Dos matrices n por m son iguales si, y sólo si, cada elemento en la primera 
matriz es igual a cada elemento en la segunda matriz; es decir, [4] =[B] si a; = b;; para todo i y j. 

La suma de dos matrices, por ejemplo, [4] y [B], se obtiene al sumar los términos correspon- 
dientes de cada matriz. Los elementos de la matriz resultante [C] son: 


Ci = Oj + Dj; 
parai=1,2,....nyj=1,2,...,m. De manera similar, la resta de dos matrices, por ejemplo, [£] 
menos [FF], se obtiene al restar los términos correspondientes así: 

di = €: —F.; 
parai=1,2,...,nyj=1,2,...,m. De las definiciones anteriores se concluye directamente que la 


suma y la resta sólo pueden realizarse entre matrices que tengan las mismas dimensiones. 


Cuadro PT3.1 Tipos especiales de matrices cuadradas 


Hay diferentes formas especiales de matrices cuadradas que son El símbolo [/] se utiliza para denotar la matriz identidad. La matriz 
importantes y que deben mencionarse: identidad tiene propiedades similares a la unidad. 
Una matriz simétrica es aquella donde a; = a, para todo i Una matriz triangular superior es aquella donde todos los ele- 


y j. Por ejemplo, 


mentos por debajo de la diagonal principal son cero, 


4 4 4 A 


51.2 
[AJ=11 3 7 [A]= y 3 ly 
2 7 8 Az Aza 
Aaz 
es una matriz simétrica de 3 por 3. 
Una matriz diagonal es una matriz cuadrada donde todos los Una matriz triangular inferior es aquella donde todos los ele- 
elementos fuera de la diagonal principal son iguales a cero, mentos por arriba de la diagonal principal son cero, 
a, 1 a; 1 
a da 4, 
[A]= E [4]= 
As Ay dy dy 
(¿A da y lg ly 
Observe que donde hay grandes bloques de elementos que son cero, Una matriz a bandas tiene todos los elementos iguales a cero, 
se dejan en blanco. con la excepción de una banda centrada sobre la diagonal principal: 
Una matriz identidad es una matriz diagonal donde todos los ds Be 
elementos sobre la diagonal principal son iguales a 1, a - 
21 22 23 
[A]= 


U]= 


Ax Az Aza 


a a 


43 44 
La matriz anterior tiene un ancho de banda de 3 y se le da un nombre 


especial: matriz tridiagonal. 
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Tanto la suma como la resta son conmutativas: 
[4] + [B] = [B] + [4] 

La suma y la resta son también asociativas, es decir, 
([4] + [BJ) + [C] = [4] + (18] + [C)) 


La multiplicación de una matriz [A] por un escalar g se obtiene al multiplicar cada elemento de [4] 
por g, como en 


[| ga,, 84% *  84j 

842 8d *"* 82 
[D]= glA]= 

| g4,, 84,2 mn 24 y | 


El producto de dos matrices se representa como [C] = [4][B], donde los elementos de [C] están 
definidos como (véase cuadro PT3.2 para tener una forma simple de conceptualizar la multiplicación 
de matrices) 


eo) mba (PT3.2) 
k=1 


Cuadro PT3.2 Un método simple para multiplicar dos matrices 


Aunque la ecuación (PT3.2) es adecuada para implementarse en una 5.9 
computadora, no es el medio más simple para visualizar la mecánica 72 
de multiplicar dos matrices. Lo que sigue es una forma más tangible de 
entender la operación. y 
Suponga que queremos multiplicar [X] por [Y] para obtener 3 11>213x5+1x7=22 
[Z], donde 8 6 
0 4 
al 5 9 De esta manera, z,, es igual a 22. El elemento z,, se calcula de ma- 
[Z]=[X][Y]=|8 6 bl a nera semejante así: 
0 4 


5 


Una forma simple para visualizar el cálculo de [Z] es subir [Y] así: 


y 
m 3 1 22 
8 6|>|8x5+6x7=82 
da a 
[Y] 0.4 
12 
Los cálculos continúan en esta forma, siguiendo la alineación 
3 1 
de renglones y columnas, para obtener el resultado 
[X]>|8 6 ? <I[Z] 
0.4 22 29 
[Z]=|82 84 
28 8 


Ahora, la matriz [Z] se puede calcular en el espacio dejado por [Y]. 

Este formato es útil, ya que alinea los renglones y columnas apropia- Observe cómo este método simple explica el porqué es imposible 
dos para que se multipliquen. Por ejemplo, de acuerdo con la ecuación multiplicar dos matrices si el número de columnas de la primera 
(PT3.2), el elemento z,, se obtiene al multiplicar el primer renglón matriz no es igual al número de renglones en la segunda matriz. Note 
de [X] por la primera columna de [Y]. Esta cantidad se obtiene al también la importancia del orden en la multiplicación (es decir, la 
sumar el producto de x,, y y¡, al producto de xy, y y», así: multiplicación de matrices no es conmutativa). 
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donde n = la dimensión columna de [4] y la dimensión renglón de 
[A ln Xx m [B ] HAS [Cl xl LB]. Es decir, el elemento c,, se obtiene al sumar el producto de ele- 
A 


mentos individuales del ¡-ésimo renglón de la primera matriz, en 
3 ñ este caso [A], por la j-ésima columna de la segunda matriz [B]. 

Las dimensiones ES Te as 
interiores De acuerdo con esta definición, la multiplicación de dos 
son iguales: matrices se puede realizar sólo si la primera matriz tiene tantas 
es posible columnas como el número de renglones en la segunda matriz. Así, 
la multiplicación si [4] es una matriz n por m, [B] podría ser una matriz m por 1. En 
Y este caso, la matriz resultante [C] tendrá dimensión n por !. Sin 

Las dimensiones exteriores 


embargo, si [B] fuera una matriz / por m, la multiplicación no 
podrá ser ejecutada. La figura PT3.3 proporciona una forma fácil 
para verificar si se pueden multiplicar dos matrices. 

Si las dimensiones de las matrices son adecuadas, la multi- 
plicación matricial es asociativa, 


definen las dimensiones 
del resultado 


Figura PT3.3 


y distributiva, 


[41(18] + [C]) = [4]1B] + [A][C] 


([4] + [BDIC] = [A][C] + [B][C] 
Sin embargo, la multiplicación en general no es conmutativa: 
[4118] + [B][A] 


Esto es, el orden de la multiplicación es importante. 

La figura PT3.4 muestra el pseudocódigo para multiplicar una matriz [4] n por m, por una 
matriz [B] m por l, y guardar el resultado en una matriz [C] n por !. Observe que, en lugar de que el 
producto interno sea directamente acumulado en [C], se recoge en una variable temporal, sum. Se 
hace así por dos razones. Primero, es un poco más eficiente, ya que la computadora necesita deter- 
minar la localización de c;, sólo n x | veces en lugar de n x lx m veces. Segundo, la precisión de la 
multiplicación puede mejorarse mucho al declarar a sum como una variable de doble precisión (re- 
cuerde el análisis de productos internos en la sección 3.4.2). 

Aunque la multiplicación es posible, la división de matrices no está definida. No obstante, si 
una matriz [4] es cuadrada y no singular, existe otra matriz [4]”!, llamada la inversa de [A], para 
la cual 


[A][4]* =[4][4] = [1] (PT3.3) 


Así, la multiplicación de una matriz por la inversa es análoga a la división, en el sentido de que un 
número dividido por sí mismo es igual a 1. Es decir, la multiplicación de una matriz por su inversa 
nos lleva a la matriz identidad (recuerde el cuadro PT3.1). 

La inversa de una matriz cuadrada bidimensional se representa en forma 


simple mediante 
SUBROUTINE Mmult (a, b, Cc, m, n, 1) 


j = Ad) —a 
on 0 a EN dl 
1122 1221 21 11 
sum = 0. 
DOFOR k= 1, m De forma similar, para matrices de dimensiones mayores las fórmulas son 
sum = sum + a(T,k) + b(k,]) más complicadas. Algunas secciones de los capítulos 10 y 11 se dedicarán a 
END DO técnicas que usen métodos numéricos y la computadora para calcular la in- 
c(1,j) = sum versa de tales sistemas. 
END DO Otras dos manipulaciones con matrices que serán útiles para nuestro 
END DO análisis son la transpuesta y la traza de una matriz. La transpuesta de una 
Figura PT3.4 matriz implica transformar sus renglones en columnas y viceversa. Por ejem- 


plo, dada la matriz de 4 x 4, 
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[4' = 


En otras palabras, el elemento a;; de la transpuesta es igual al elemento a, de la matriz original. 
La transpuesta tiene muchas funciones en álgebra matricial. Una ventaja es que permite escribir 
un vector columna como un renglón. Por ejemplo, si 


entonces 
(Cy =Lc, C2 C3 cal 


donde el superíndice T indica la transpuesta. Por ejemplo, esto puede ahorrar espacio cuando se 
escribe un vector columna. Además, la transpuesta tiene diversas aplicaciones matemáticas. 

La traza de una matriz es la suma de los elementos en su diagonal principal, se designa como 
tr [4] y se calcula como 


tr[A]= Y a, 


i=1 


La traza se usará en el análisis de valores propios en el capítulo 27. 

La última manipulación de una matriz que resultará de utilidad para nuestro análisis es el au- 
mentar. Una matriz es aumentada al agregar una columna (o columnas) a la matriz original. Por 
ejemplo, suponga que tenemos una matriz de coeficientes: 


Por ejemplo, se puede aumentar esta matriz [4] con una matriz identidad (recuerde el cuadro PT3.1) 
para obtener una matriz de dimensiones 3 por 6: 


Tal expresión es útil cuando debe ejecutarse un conjunto de operaciones idénticas sobre dos matrices. 
Así, podemos realizar las operaciones sobre una sola matriz aumentada, en lugar de hacerlo sobre 
dos matrices individuales. 
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PT3.2.3 Representación de ecuaciones algebraicas lineales 
en forma matricial 


Debe ser claro que las matrices proporcionan una notación concisa para representar ecuaciones li- 
neales simultáneas. Por ejemplo, la ecuación (PT3.1) puede expresarse como 


[41(4) = (B) (PT3.5) 


donde [4] es la matriz cuadrada n por n de coeficientes, 


|4,, Ao An | 

(5) es el vector columna n por 1 de las constantes, 
(By"=Lb, b, + br) 

y ([X) es el vector columna n por 1 de las incógnitas: 
O =Llx xx, 


Recuerde la definición de multiplicación de matrices [ecuación (PT3.2) o cuadro PT3.2] para com- 
probar que las ecuaciones (PT3.1) y (PT3.5) son equivalentes. También, observe que la ecuación 
(PT3.5) es una multiplicación matricial válida, ya que el número de columnas, n, de la primera 
matriz [A], es igual al número de renglones, n, de la segunda matriz (X]). 

Esta parte del libro se dedica a encontrar la solución (X] de la ecuación (PT3.5). La manera 
formal de obtener la solución usando álgebra matricial es multiplicando cada lado de la ecuación por 
la inversa de [A]: 


[ATAJOS = [43(B) 
Como [4]7'[4] es igual a la matriz identidad, la ecuación se convierte en 
(9 =[4J"(B) (PT3.6) 


Por lo tanto, se ha encontrado la solución (X) de la ecuación. Éste es otro ejemplo de cómo la inver- 
sa desempeña un papel importante en el álgebra de matrices que es similar a la división. Debe obser- 
varse que ésta no es una forma muy eficiente para resolver un sistema de ecuaciones. Así, se emplean 
otros procedimientos para construir los algoritmos numéricos. Sin embargo, como se analizó en el 
capítulo 10, la matriz inversa tiene gran valor en los análisis de ingeniería de tales sistemas. 

Por último, algunas veces encontraremos útil aumentar [4] con (B). Por ejemplo, si n = 3, re- 
sultará una matriz de dimensión 3 por 4: 


[A]=| a, 4 4, :D, (PT3.7) 


Expresar las ecuaciones en esta forma es útil, ya que varias de las técnicas para resolver sistemas 
lineales requieren operaciones idénticas en un renglón de coeficientes y en las correspondientes 
constantes del lado derecho. Como se expresa en la ecuación (PT3.7), es posible realizar las mani- 
pulaciones de una vez sobre un renglón de la matriz aumentada, en lugar de hacerlo de manera se- 
parada sobre la matriz de coeficientes y en el vector del lado derecho. 
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PT3.3 Orientación 


Antes de presentar los métodos numéricos, será útil una orientación adicional. Lo siguiente pretende 
ser una visión general del material analizado en la parte tres. Además, se plantean algunos objetivos 
para ayudarle a enfocar sus esfuerzos al estudiar el material. 


PT3.3.1 Alcance y presentación preliminar 


La figura PT3.5 proporciona un resumen de la parte tres. El capítulo 9 se dedica a la técnica funda- 
mental para resolver sistemas algebraicos lineales: la eliminación de Gauss. Antes de entrar en un 
análisis detallado de dicha técnica, una sección preliminar trata de los métodos simples para resolver 
sistemas pequeños. Esos procedimientos se presentan para ofrecer cierto conocimiento visual y 
porque uno de los métodos (la eliminación de incógnitas) representa la base para la eliminación de 
Gauss. 

Después del material preliminar, se estudia la eliminación de Gauss “simple”. Comenzamos con 
esta versión “desnuda” debido a que permite elaborar la técnica fundamental sin detalles que la 
compliquen. Después, en las siguientes secciones, analizamos problemas potenciales del método 
simple y presentamos diferentes modificaciones para minimizar y evitar tales problemas. Lo esencial 
en este análisis será el proceso de intercambio de renglones, o pivoteo parcial. 

El capítulo 10 empieza ilustrando cómo se puede formular la eliminación de Gauss como una 
solución por descomposición LU. Se trata de técnicas de solución que son valiosas para los casos 
donde se necesita evaluar muchos vectores del lado derecho. Se muestra cómo este atributo permite 
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190 


Parte 3 Ecuaciones algebraicas lineales 


hacer eficiente el cálculo de la matriz inversa, la cual tiene una tremenda utilidad en la práctica de 
la ingeniería. Por último, el capítulo termina con un estudio de la condición matricial. El número 
de condición se presenta como una medida de la pérdida de dígitos significativos de exactitud que 
puede resultar cuando se resuelven matrices mal condicionadas. 

El inicio del capítulo 11 se concentra en los tipos especiales de sistemas de ecuaciones que 
tienen una gran aplicación en ingeniería. En particular, se presentan técnicas eficientes para re- 
solver sistemas tridiagonales. Después, en el resto del capítulo se centra la atención en una alter- 
nativa a los métodos de eliminación llamada el método de Gauss-Seidel. Esta técnica es similar 
en esencia a los métodos aproximados para raíces de ecuaciones que se analizaron en el capítulo 6. 
Es decir, la técnica consiste en suponer una solución y después iterar para obtener una aproximación 
mejorada. Al final del capítulo se incluye información relacionada con la solución de ecuaciones 
algebraicas lineales con ayuda de paquetes de software. 

En el capítulo 12 se muestra cómo se aplican realmente los métodos para la solución de problemas. 
Como en las otras partes del libro, las aplicaciones se toman de todos los campos de la ingeniería. 

Por último, se incluye un epílogo al final de la parte tres. Este repaso comprende un análisis de 
las ventajas y desventajas relevantes para la implementación de los métodos en la práctica de la in- 
geniería. Esta sección también resume las fórmulas importantes y los métodos avanzados relaciona- 
dos con las ecuaciones algebraicas lineales. Como tal, puede usarse antes de los exámenes o en la 
práctica profesional, a manera de actualización, cuando se tenga que volver a considerar las ecua- 
ciones algebraicas lineales. 


PT3.3.2 Metas y objetivos 


Objetivos de estudio Al terminar la parte tres, usted será capaz de resolver problemas con ecua- 
ciones algebraicas lineales y de valorar la aplicación de esas ecuaciones en muchos campos de la in- 
geniería. Deberá esforzarse en dominar varias técnicas y su confiabilidad, así como conocer las 
ventajas y desventajas para seleccionar el “mejor” método (o métodos) para cualquier problema en 
particular. Además de estos objetivos generales, deberán asimilarse y dominarse los conceptos espe- 
cíficos enlistados en la tabla PT3.1. 


Objetivos de cómputo Sus objetivos de cómputo fundamentales son ser capaz de resolver un 
sistema de ecuaciones algebraicas lineales y evaluar la matriz inversa. Usted deberá tener subpro- 
gramas desarrollados para una descomposición LU, tanto de matrices completas como tridiagonales. 
Quizá desee también tener su propio software para implementar el método Gauss-Seidel. 

Deberá saber cómo usar los paquetes para resolver ecuaciones algebraicas lineales y encontrar 
la matriz inversa. También deberá conocer muy bien la manera en que las mismas evaluaciones se 
pueden implementar en paquetes de uso común, como Excel, MATLAB y Mathcad. 


Tabla PT3.1 Objetivos específicos de estudio de la parte tres. 


1. Comprender la interpretación gráfica de sistemas mal condicionados y cómo se relacionan con el determinante. 
2. Conocer la terminología: eliminación hacia adelante, sustitución hacia atrás, ecuación pivote y coeficiente pivote. 
3. Entender los problemas de división entre cero, errores de redondeo y mal condicionamiento. 
4. Saber cómo calcular el determinante con la eliminación de Gauss. 
5. Comprender las ventajas del pivoteo; notar la diferencia entre pivoteos parcial y completo. 
6. Saber la diferencia fundamental entre el método de eliminación de Gauss y el de Gauss-Jordan y cuál es más 
eficiente. 
7. Reconocer el modo en que la eliminación de Gauss se formula como una descomposición LU. 
8. Saber cómo incorporar el pivoteo y la inversión de matrices en un algoritmo de descomposición LU. 
9. Conocer el modo de interpretar los elementos de la matriz inversa al evaluar cálculos de respuesta al estímulo 
en ingeniería. 
10. Percatarse del modo de usar la inversa y las normas de matrices para evaluar la condición de un sistema. 
11. Entender cómo los sistemas bandeados y simétricos pueden descomponerse y resolverlos de manera eficiente. 
12. Entender por qué el método de Gauss-Seidel es adecuado para grandes sistemas de ecuaciones dispersos. 
13. Comprender cómo valorar la diagonal dominante de un sistema de ecuaciones y el modo de relacionarla con 
el sistema para que pueda resolverse con el método de Gauss-Seidel. 
14. Entender la fundamentación de la relajación; saber dónde son apropiadas la bajorrelajación y la sobrerrelajación. 


Eliminación de Gauss 


En este capítulo se analizan las ecuaciones algebraicas lineales simultáneas que en general se repre- 
sentan como 


4, +0 Xx, + +4), Xx, =D, 
4) X, +0)X, + "+4, Xx, =b, 
(9. 1) 


Ary + 42% re AnnKkn = b, 


donde las a son los coeficientes constantes y las b son los términos constantes. 

La técnica que se describe en este capítulo se conoce como la eliminación de Gauss, ya que 
implica una combinación de ecuaciones para eliminar las incógnitas. Aunque éste es uno de los méto- 
dos más antiguos para resolver ecuaciones lineales simultáneas, continúa siendo uno de los algoritmos 
de mayor importancia, y es la base para resolver ecuaciones lineales en muchos paquetes de software 
populares. 


9.1 SOLUCIÓN DE SISTEMAS PEQUEÑOS DE ECUACIONES 


Antes de analizar los métodos computacionales, describiremos algunos métodos que son apropiados 
en la solución de pequeños sistemas de ecuaciones simultáneas (n <= 3) que no requieren de una 
computadora. Estos son el método gráfico, la regla de Cramer y la eliminación de incógnitas. 


9.1.1 Método gráfico 


Para dos ecuaciones se puede obtener una solución al graficarlas en coordenadas cartesianas con un 
eje que corresponda a x, y el otro a x,. Debido a que en estos sistemas lineales, cada ecuación se 
relaciona con una línea recta, lo cual se ilustra fácilmente mediante las ecuaciones generales 


411%; + 4192 = by 


471%, + 49%) =D, 


En ambas ecuaciones se puede despejar x,: 


a b 
x= lx +2 
4) 4) 
a b 
x= lx, +2 
A 4, 


De esta manera, las ecuaciones ahora están en la forma de líneas rectas; es decir, x, = (pendiente) 
x¡ + intercepto. Tales líneas se grafican en coordenadas cartesianas con x, como la ordenada y x;¡ 
como la abscisa. Los valores de x, y x, en la intersección de las líneas representa la solución. 
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EJEMPLO 9.1 El método gráfico para dos ecuaciones 


Planteamiento del problema Con el método gráfico re- 


suelva 
3x, + 2x, = 18 (E9.1.1) 
8 —x1 + 2x7 =2 (E9.1.2) 


Solución Sea x; la abscisa. Despejando x, de la ecuación (E9.1.1) 


Xx, =- - x, +9 
Solución: x, = 4; x, = 3 
la cual, cuando se grafica como en la figura 9.1, es una línea rec- 
ta con un intercepto en 9 y una pendiente de 3/2. 
También de la ecuación (E9.1.2) se despeja x>: 
1 


Xx, A 


la cual también se grafica en la figura 9.1. La solución es la inter- 
sección de las dos líneas en x, = 4 y x, = 3. Este resultado se ve- 


I 
I 
I 
I 
I 
I 
I 
I 
] 
0 2 4 6 x, rifica al sustituir los valores en las ecuaciones originales para 


0 | 
obtener 
Figura 9.1 3(4) + 2(3) = 18 
Solución gráfica de un conjunto de dos ecuaciones alge- 4)+263)=2 
braicas lineales simultáneas. 
La intersección de las líneas representa la solución. De esta manera, los resultados son equivalentes a los valores de 
la derecha en las ecuaciones originales. 
Para tres ecuaciones simultáneas, cada ecuación se representa como un plano en un sistema de 
coordenadas tridimensional. El punto en donde se intersecan los tres planos representa la solución. 
Para más de tres incógnitas, los métodos gráficos no funcionan y, por consiguiente, tienen poco valor 
práctico para resolver ecuaciones simultáneas. No obstante, resultan útiles para visualizar propieda- 
des de las soluciones. Por ejemplo, la figura 9.2 muestra tres casos que pueden ocasionar problemas 
al resolver sistemas de ecuaciones lineales. La figura 9.2a presenta el caso en que las dos ecuaciones 
representan líneas paralelas. En estos casos no existe solución, ya que las dos líneas jamás se cruzan. 
XA A A 


Figura 9.2 

Representación gráfica de sistemas singulares y mal condicionados: a) no hay solución, b) hay una infi- 
nidad de soluciones y c) sistema mal condicionado donde las pendientes son tan cercanas que es difícil 
detectar visualmente el punto de intersección. 


9.1 Solución de sistemas pequeños de ecuaciones 


La figura 9.2b representa el caso en que las dos líneas coinciden. En éste existe un número infinito de 
soluciones. Se dice que ambos tipos de sistemas son singulares. Además, los sistemas muy próximos 
a ser singulares (figura 9.2c) también pueden causar problemas; a estos sistemas se les llama mal 
condicionados. Gráficamente, esto corresponde al hecho de que resulta difícil identificar el punto 
exacto donde las líneas se intersecan. Los sistemas mal condicionados presentan problemas cuando 
se encuentran durante la solución numérica de ecuaciones lineales, lo cual se debe a que este tipo de 
sistemas son extremadamente sensibles a los errores de redondeo (recuerde la sección 4.2.3). 


9.1.2 Determinantes y la regla de Cramer 


La regla de Cramer es otra técnica de solución adecuada para un sistema pequeño de ecuaciones. 
Antes de hacer una descripción de tal método, se mencionará en forma breve el concepto de deter- 
minante que se utiliza en la regla de Cramer. Además, el determinante tiene relevancia en la evalua- 
ción del mal condicionamiento de una matriz. 


Determinantes El determinante se puede ilustrar para un sistema de tres ecuaciones simultáneas: 
[ANA] =(B) 
donde [4] es la matriz de coeficientes: 


a a 


11 
[A]=| 4, 4, 4, 


12 
dz Az dz 


El determinante D de este sistema se forma, a partir de los coeficientes de la ecuación, de la siguien- 
te manera: 


D=|4, 4, dz (9.2) 


Aunque el determinante D y la matriz de coeficientes [4] se componen de los mismos elementos, 
son conceptos matemáticos completamente diferentes. Por esto, para distinguirlos visualmente se 
emplean corchetes para encerrar la matriz y líneas rectas verticales para el determinante. En con- 
traste con una matriz, el determinante es un simple número. Por ejemplo, el valor del determinante 
de segundo orden 


se calcula como 
D = 41147, — 414) (9.3) 


En el caso del determinante de tercer orden [ecuación (9.2)], el determinante, que es un simple valor 
numérico, se calcula así 


a a a a a a 
2 Az a Az 21 A, 
D=a,, 4, +41, (9.4) 
Aa 33 43 Az 3 Az 


donde a los determinantes de 2 por 2 se les llama menores. 
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EJEMPLO 9.2 Determinantes 


Planteamiento del problema Calcule los valores para los determinantes de los sistemas repre- 
sentados en las figuras 9.1 y 9.2. 


Solución Para la figura 9.1: 


2 
D= = 32)-2+1)=8 
a (2)-2-D 
Para la figura 9.2a: 
=Y2 1| -— ES 
D= = La) 1 > )=0 
-12 1| 2 2 
Para la figura 9.2b: 
»D= 0% o lo-en=o 
=_, ¿3 0-16D= 
Para la figura 9.2c: 
-112 1| — E 
D= = La) 1 =)- 0.04 
2.395 1| 2 y) 


En el ejemplo anterior, los sistemas singulares tienen determinante cero. Además, los resultados 
sugieren que el sistema que sea casi singular (figura 9.2c) tiene un determinante cercano a cero. 
Estas ideas se tratarán también en análisis subsecuentes de mal condicionamiento (sección 9.3.3). 


Regla de Cramer Esta regla establece que cada incógnita de un sistema de ecuaciones lineales 
algebraicas puede expresarse como una fracción de dos determinantes con denominador D y con el 
numerador obtenido a partir de D, al reemplazar la columna de coeficientes de la incógnita en cues- 
tión por las constantes b,, b,, ..., b,. Por ejemplo, x, se calcula como 


b, 4), 4, 


x= (9.5) 


EJEMPLO 9.3 Regla de Cramer 


Planteamiento del problema Utilice la regla de Cramer para resolver 


035 +052%+%=-0.01 
0.5x; +x2+ 1.9x; = 0.67 
01%,+0.31,+0.5%,= 044 


Solución El determinante D se puede escribir como [ecuación (9.2)] 


0.3 0.52 1 
D=|05 1 1.9 
0.1 0.3 0.5 


Los menores son [ecuación (9.3)] 


9.1 Solución de sistemas pequeños de ecuaciones 


1 19 
A = = 1(0.5) —1.9(0.3) = 0.07 
e os 10,5) =1,9(0.3) 
A, = AS = 0.5(0.5) -1.9(0.1) =0.06 
201 051). 00 ARS 
A,= o = 0.5(0.3) -1(0.1) =0.05 
¿A a a UE o 5 A IÓ TREO 


Estos se usan para evaluar el determinante, como en [ecuación (9.4)] 


D = 0.3(-0.07) — 0.52(0.06) + 1(0.05) = -0.0022 


Aplicando la ecuación (9.5), la solución es 


0.01 0.52 1 
0.67 1 19 
0.44 03 05| 0, 
En 008278 44: 
0.0022 -0.0022 
0.3 0.01 1 
0.5 0.67 19 
0.1 -0.44 0.5 : 
e _ 0.0649 _ 705 
0.0022 -0.0022 
0.3 0.52 -0.01 
0.5 1 0.67 
0.1 0.3 -0.44| -0.04356 
x,= - =19.8 
0.0022 -0.0022 


Para más de tres ecuaciones, la regla de Cramer no resulta práctica, ya que, conforme aumenta 
el número de ecuaciones, los determinantes consumen tiempo al evaluarlos manualmente (o por 
computadora). Por consiguiente, se usan otras alternativas más eficientes. Algunas de éstas se basan 
en la última técnica, sin el uso de la computadora, que se analizará en la siguiente sección: la elimi- 
nación de incógnitas. 


9.1.3 La eliminación de incógnitas 


La eliminación de incógnitas mediante la combinación de ecuaciones es un método algebraico que 
se ilustra con un sistema de dos ecuaciones simultáneas: 


011%] + a49Xx,=b; (9.6) 
02141 + (977 X) = b, (9.7) 
La estrategia básica consiste en multiplicar las ecuaciones por constantes, de tal forma que se elimi- 
ne una de las incógnitas cuando se combinen las dos ecuaciones. El resultado es una sola ecuación 
en la que se puede despejar la incógnita restante. Este valor se sustituye en cualquiera de las ecua- 


ciones originales para calcular la otra variable. 
Por ejemplo, la ecuación (9.6) se multiplica por a», y la ecuación (9.7) por a,, para dar 


411031X¡ + 4174)1X, = b,0>1 (9.8) 


47141X] + 49,411X, = b,411 (9.9) 
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Restando la ecuación (9.8) de la (9.9) se elimina el término x, de las ecuaciones para obtener 
477411X) — 417491X, = b,411 — b,0), 
de donde se puede despejar 


a,b, — a,b, (9.10) 
4,143, = 4124), 


Xx, = 


La ecuación (9.10) se puede entonces sustituir en la ecuación (9.6), de la cual se puede despejar 
a ab, - ayb, (9.11) 
4:14), — 4124); 
Observe que las ecuaciones (9.10) y (9.11) se relacionan directamente con la regla de Cramer, que 
establece 


b, 4), 

X= b, 4, b,4,, — 41,b, 
41 4, 4,4), — 4124), 
da Az 

di  D, 

x, = da db, a,1b, —b,4,, 
4 4) 4/47, — 4120), 
da Az 


EJEMPLO 9.4 Eliminación de incógnitas 


Planteamiento del problema Use la eliminación de incógnitas para resolver (recuerde el 
ejemplo 9.1) 


3x1 + 2x> = 18 
—X + 2x» =2 


Solución Utilizando las ecuaciones (9.11) y (9.10), 


Ñ 2(18) -2(2) A 
" 3Q)-21) 
e 32) - (2118 -3 
*  30)-2D 
cuyos valores coinciden con la solución gráfica (figura 9.1). 


La eliminación de incógnitas se puede extender a sistemas con más de dos o tres ecuaciones. 
Sin embargo, los múltiples cálculos que se requieren para sistemas más grandes hacen que el méto- 
do sea extremadamente tedioso para realizarse a mano. No obstante, como se describe en la siguien- 
te sección, la técnica llega a formalizarse y programarse fácilmente en la computadora. 


9.2 ELIMINACIÓN DE GAUSS SIMPLE 


En la sección anterior se utilizó la eliminación de incógnitas para resolver un par de ecuaciones si- 
multáneas. El procedimiento consistió de dos pasos: 


1. Las ecuaciones se manipularon para eliminar una de las incógnitas de las ecuaciones. El resultado 
de este paso de eliminación fue el de una sola ecuación con una incógnita. 


9.2 Eliminación de Gauss simple 


2. En consecuencia, esta ecuación se pudo resolver directamente y el resultado sustituirse atrás en 
una de las ecuaciones originales para encontrar la incógnita restante. 


Esta técnica básica puede extenderse a sistemas grandes de ecuaciones desarrollando un esque- 
ma sistemático o algorítmico para eliminar incógnitas y sustituir hacia atrás. La eliminación de 
Gauss es el más básico de dichos esquemas. 

Esta sección presenta las técnicas sistemáticas para la eliminación hacia adelante y la sustitución 
hacia atrás que la eliminación gaussiana comprende. Aunque tales técnicas son muy adecuadas para 
utilizarlas en computadoras, se requiere de algunas modificaciones para obtener un algoritmo con- 
fiable. En particular, el programa debe evitar la división entre cero. Al método siguiente se le llama 
eliminación gaussiana “simple”, ya que no evita este problema. En las siguientes secciones se verán 
algunas características adicionales necesarias para obtener un programa de cómputo efectivo. 

El método está ideado para resolver un sistema general de n ecuaciones: 


411%] + 019X) + 0133 +++ ++ 4) X, =D (9.12a) 
491X] + 079X) + 093% +++ ++ yy Xy = Da (9.12b) 
AX] + O p97X7 + 0p3X3 +++ + O ppXy = b, (9.12c) 


Como en el caso de dos ecuaciones, la técnica para resolver n ecuaciones consiste en dos fases: la 
eliminación de las incógnitas y su solución mediante sustitución hacia atrás. 


Eliminación hacia adelante de incógnitas La primera fase consiste en reducir el conjunto de 
ecuaciones a un sistema triangular superior (figura 9.3). El paso inicial será eliminar la primera 
incógnita, x,, desde la segunda hasta la n-ésima ecuación. Para ello, se multiplica la ecuación (9.12a) 
por a»¡/a,, para obtener 
A,¡X; +% g,,x, Hot Ba e =2), (9.13) 
11 41 4; 


Ahora, esta ecuación se resta de la ecuación (9.12b) para dar 
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4) 4) a 4) 
dy => > A) M2 +: +| 0), A 41, X, =D, = 4 b, 
11 11 11 EE iaa 
dam an 83 1 bs 
9 aa a 
, , _2p ; 0 de 
49 X7 +++ 077 X, =D, EEES D31 | Eliminación 
donde el superíndice prima indica que los elementos han cambiado sus valores y EA 
originales. ara Ow de 1 (91 
El procedimiento se repite después con las ecuaciones restantes. Por A OS 
ejemplo, la ecuación (9.12a) se puede multiplicar por ax;/a,, y el resultado se o 
resta de la tercera ecuación. Se repite el procedimiento con las ecuaciones E De 
restantes y da como resultado el siguiente sistema modificado: y 
AX + 019%) + 03% + == + 01, X, =D) (9.14a) po Sustitución 
X2 = (b) — a23X3)/a52 hacia 
5717 + 2303 + 0 + Ay =D") (9.14b) / atrás 
, , Ñ ] Xx =(b1 — a12X2 — a13X3)/911 
Ax + AU 3x3 + + px, =D" (9.14c) 
Figura 9.3 
Las dos fases de la eliminación de Gauss: elimi- 
nación hacia adelante y sustitución hacia atrás. 
Los superíndices prima indican el número de 
Aj2X> + Al 3X3 Ate A ann = Dv, (9.14d) p B 


veces que se han modificado los coeficientes y 


En los pasos anteriores, la ecuación (9.12a) se llama la ecuación pivote, y ay, constantes. 
se denomina el coeficiente o elemento pivote. Observe que el proceso de 
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multiplicación del primer renglón por a,,/a,, es equivalente a dividirla entre a,, y multiplicarla por 
a, Algunas veces la operación de división es referida como normalización. Se hace esta distinción 
porque un elemento pivote cero llega a interferir con la normalización al causar una división entre 
cero. Más adelante se regresará a este punto importante, una vez que se complete la descripción de 
la eliminación de Gauss simple. 

Ahora se repite el procedimiento antes descrito para eliminar la segunda incógnita en las ecua- 
ciones (9.14c) hasta (9.14d). Para realizar esto, multiplique la ecuación (9.14b) por a3,/a”,, y reste el 
resultado de la ecuación (9.14c). Se realiza la eliminación en forma similar en las ecuaciones restan- 
tes para obtener 

A11X] + 017X) + O13%3 ++ > ++ 017X, =01 

Es Je e JE 
177X) + 093X3 ++ > ++ AX, =D 
aX; AE Es = b”, 
5x3 E da = b”, 
donde el superíndice biprima indica que los elementos se han modificado dos veces. 

El procedimiento puede continuar usando las ecuaciones pivote restantes. La última manipula- 
ción en esta secuencia es el uso de la (n — 1)-ésima ecuación para eliminar el término x,, , de la 
n-ésima ecuación. Aquí el sistema se habrá transformado en un sistema triangular superior (véase el 
cuadro PT3.1): 

(111X] + 019X) + 013X3 + EA? + 417Xp =0 (9.154) 

A A O (9.15b) 
Ax +0 +4, =0b% (9.15c) 
as rx. =b 2 (9.15d) 
El pseudocódigo para implementar la eliminación hacia 
adelante se presenta en la figura 9.4a. Observe que tres loops o 
a) DOFOR k= 1, n- 1 ciclos anidados proporcionan una representación concisa del 
DOFOR 1=k +1, n proceso. El ciclo externo mueve hacia abajo de la matriz el renglón 
factor = dix Í/ des ivote. El siguiente ciclo mueve hacia abajo el renglón pivote a 
. p g y gión p 
o RE cada renglón subsecuente, donde la eliminación se llevará a cabo. 
dij = di ¡y > Factor -+ dry : : E z 
END DO Finalmente, el ciclo más interno avanza a través de las columnas 
_ para eliminar o transformar los elementos de un renglón determi- 
bi; = bi, factor + bi 
END DO nado. 
END DO A ] 
b x=b/a Sustitución hacia atrás De la ecuación (9.15d) ahora se des- 
) n n n,n e 
DOFOR ¡=n=1, 1, —1 peja x,,: 
sum = b; 
DOFOR j= 1 +1, nm Boa 
J a (9.16) 
Sum = SUM = dj Xj 03 
END DO 
Xx; = sum / a; Este resultado se puede sustituir hacia atrás en la (n — 1)-ésima 
END DO ecuación y despejar x, _ ¡. El procedimiento, que se repite para 
. evaluar las x restantes, se representa mediante la fórmula: 
Figura 9.4 


Pseudocódigo que realiza a) la eliminación hacia adelante y 
b) la sustitución hacia atrás. 


n 
(1) (i-1) 
b; aj 'X; 


x= parai=n-1,n-2, ,l (9.17) 


9.2 Eliminación de Gauss simple 


El pseudocódigo para implementar las ecuaciones (9.16) y (9.17) se representa en la figura 9.4b. 
Observe la similitud entre este pseudocódigo y el mostrado en la figura PT3.4 para la multiplicación 
de matrices. De la misma forma que en la figura PT3.4, se utiliza una variable temporal sum para 
acumular la sumatoria de la ecuación (9.17). Esto da por resultado un tiempo de ejecución más rá- 
pido que si la sumatoria fuera acumulada en b,. Más importante aún es que esto permite una mayor 
eficiencia en la precisión si la variable, sum, se declara como variable de doble precisión. 


EJEMPLO 9.5 Eliminación de Gauss simple 


Planteamiento del problema Emplee la eliminación de Gauss para resolver 


3x, -0.1x, — 0.2x3 =7.85 (E9.5.1) 
0.1x, +7x,-0.3x, =-19.3 (E9.5.2) 
0.3x, — 0.2x, + 10x3=71.4 (E9.5.3) 


Efectúe los cálculos con seis cifras significativas. 
Solución La primera parte del procedimiento es la eliminación hacia adelante. Se multiplica la 
ecuación (E9.5.1) por (0.1)/3 y se resta el resultado de la ecuación (E9.5.2) para obtener 

7.00333x, — 0.293333x3 = --19.5617 


Después, se multiplica la ecuación (E9.5.1) por (0.3)/3 y se resta de la ecuación (E9.5.3) para elimi- 
nar x,. Luego de efectuar estas operaciones, el sistema de ecuaciones es 


3x,  -—0.lx, -0.2x, =7.85 (E9.5.4) 
7.00333x, — 0.293333x3 =-19.5617 (E9.5.5) 
-0.190000x, + 10.0200x,  =70.6150 (E9.5.6) 


Para completar la eliminación hacia adelante, x, debe eliminarse de la ecuación (E9.5.6). Para llevar 
a cabo esto, se multiplica la ecuación (E9.5.5) por -0.190000/7.00333 y se resta el resultado de la 
ecuación (E9.5.6). Esto elimina x, de la tercera ecuación y reduce el sistema a una forma triangular 
superior: 


3x, -0.Lx, -0.2x3 =7.85 (E9.5.7) 
7.00333x, — 0.293333x3 =-19.5617 (E9.5.8) 
10.0120x, =70.0843 (E9.5.9) 


Ahora se pueden resolver estas ecuaciones por sustitución hacia atrás. En primer lugar, de la ecuación 
(E9.5.9) se despeja x3 


70.0843 
X= = 
”  10.0120 


Este resultado se sustituye en la ecuación (E9.5.8): 


7.0000 (E9.5.10) 


7.00333x, — 0.293333 (7.0000) = -19.5617 


de la que se despeja 


ye -19.5617+0.293333(7.0000) = -2.50000 (E9.5.11) 
7.00333 


Por último, las ecuaciones (E9.5.10) y (E9.5.11) se sustituyen en la (E9.5.4): 
3x¡ — 0.1(22.50000) — 0.2(7.0000) = 7.85 
de donde se puede despejar 


Na 7.85+0.1(2.50000) + 0.2(7.0000) 


: =3.00000 
3 
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Los resultados son muy cercanos a la solución exacta, x, = 3, x, =-2.5 y x3 =7. Esto se puede veri- 
ficar sustituyendo los resultados en el sistema de ecuaciones original: 


3(3) - 0.1(22.5) - 0.2(7) = 7.85 
0.16) +7(2.5) - 0.3(7) = -19.3 
0.33) - 0.2(2.5) + 10(7) = 71.4 


9.2.1 Conteo de las operaciones 


El tiempo de ejecución de la eliminación de Gauss depende de la cantidad de operaciones con pun- 
to flotante (floating point operations = “flops”) incluidas en el algoritmo. En las computadoras 
modernas que usan coprocesadores matemáticos, el tiempo empleado para realizar suma/resta y 
multiplicación/división es aproximadamente el mismo. Por lo tanto, la totalización de estas opera- 
ciones permite comprender cuáles partes del algoritmo consumen más tiempo y cómo aumenta el 
tiempo de computación al hacerse más grande el sistema. 

Antes de analizar la eliminación de Gauss simple, primero se definirán algunas cantidades que 
facilitan el conteo de operaciones: 


O S Y 10 S 1080 a S 10 Y g0 (9.18a, b) 
¡= i=1 ¡=1 i=1 i=1 

indio Y i=mok+1 (9.18c, d) 
i= i=k 


Y i=14243+=+m= 


l= 


mm+D) m? 
PESO 
> 2 +0(m) (9.18€e) 


YN P=24+24+3 44m 


i= 


3 
A +0) (9.18) 


donde O(mm”) significa “términos de orden m” y menores”. 

Ahora se examinará en forma detallada el algoritmo de la eliminación de Gauss simple (figura 
9.4). Primero se contarán los flops en la etapa de la eliminación. En el primer paso durante el loop 
o ciclo externo, k= 1. Por lo tanto, los límites del ciclo intermedio son desde ¡ = 2 hasta n. De acuer- 
do con la ecuación (9.18d), esto significa que el número de iteraciones en el ciclo intermedio será 


Y 1=n-2+1=n-1 (9.19) 
t=2 


Ahora, para cada una de estas iteraciones, hay una división para definir el factor. El ciclo interno 
realiza después una sola multiplicación y resta para cada iteración de ¡=2 a n. Por último, hay una 
multiplicación y resta adicional del valor del lado derecho. Así, en cada iteración del ciclo intermedio, 
el número de multiplicaciones es 


1+[n-2+1]+1=1+n (9.20) 


Las multiplicaciones totales para el primer paso a través del ciclo exterior se obtienen, por lo tanto, 
multiplicando la ecuación (9.19) por la (9.20), para dar [n — 1111 + n). De modo similar, el número 
de restas se calcula como [n — 1](n). 

Se puede usar un razonamiento similar para estimar los flops para las iteraciones subsecuentes 
del ciclo externo. Esto se puede resumir como se muestra en la tabla de la página siguiente. 

Por lo tanto, el total de flops de la suma/resta para el proceso de eliminación se calcula como 


Y a-a+1-1)=Y Inn+D-K2n+1D+4] 


9.2 Eliminación de Gauss simple 


Ciclo externo (k) Ciclo medio (7) Flops de suma/resta Flops de multiplicación/división 
1 2,n (n— 1) (n) (n- Din + 1) 
2 3,n (n — 2n — 1) (n — 2)n) 
k k+1n (n-— Kin + 1-K) (n— kn +2 -k) 
n-=1 n,n (1) (2) (1063) 
o bien 


n-1 n-1 n-1 
n(n+1)) 1-Cn+1)) k+Yk 
k=1 k=1 k=1 
Al aplicar alguna de las relaciones de la ecuación (9.18) se obtiene 


3 


[n*+0(1)]-[né +0(17)+ ES +00) = 2+0(m) (9.21) 
Un análisis similar para los flops de la multiplicación/división lleva a lo siguiente 
1 3: 
[n*+0(1)-[n* +0(n) + ES di Ot) | = a O(n”) (9.22) 


Al sumar el resultado queda 


2n* 
—=+0(n? 
3 (15) 


Así, el número total de flops es igual a 2n7/3 más un componente adicional de proporcionalidad 
para términos de orden n? y menores. El resultado se escribe de esta manera porque conforme n cre- 
ce, los términos O(n?) y menores se hacen despreciables. Por lo tanto, se justifica concluir que para 
un valor de n grande, el esfuerzo necesario para la eliminación hacia adelante converge a 2n7/3. 

Debido a que sólo se utiliza un loop o ciclo, la sustitución hacia atrás es mucho más fácil de 
evaluar. El número de flops adicionales para la suma/resta es igual a n(n— 1)/2. Debido a la división 
adicional anterior al ciclo, el número de flops para la multiplicación/división es n(n + 1)/2. Esto se 
suma para llegar a un total de 


n+0(n) 


Entonces, el trabajo total en la eliminación de Gauss simple se representa como 


2n* 2 2 conforme n 2n* 2 
ie —_Sonformen 2% 2 
3 +0(n*)+ n* +0(n) E 3 +0(n”) (9.23) 
Eliminación Sustitución 
hacia adelante hacia atrás 


En este análisis destacan dos conclusiones generales útiles: 


1. Conforme el sistema se vuelve más grande, el tiempo de cálculo aumenta enormemente. Como 
en la tabla 9.1, la cantidad de flops aumenta casi tres órdenes de magnitud por cada orden de 
aumento de la dimensión. 

2. La mayor parte del trabajo ocurre en el paso de eliminación. Así, para hacer el método más 
eficiente, debería enfocarse a este paso. 
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Tabla 9.1 Número de flops en la eliminación de Gauss simple. 


Sustitución Flops Porcentaje debido 


n Eliminación hacia atrás totales 2n3/3 a la eliminación 
10 705 100 805 667 87.58% 
100 671550 10000 681550 666667 98.53% 
1000 6.67 x 108 1 x 108 6.68 x 108 6.67 x 108 99.85% 


9.3 DIFICULTADES EN LOS MÉTODOS DE ELIMINACIÓN 


Mientras que hay muchos sistemas de ecuaciones que se pueden resolver con la eliminación de Gauss 
simple, existen algunas dificultades que se deben analizar, antes de escribir un programa de cómpu- 
to general donde se implemente el método. Aunque el siguiente material se relaciona en forma di- 
recta con la eliminación de Gauss simple, la información también es relevante para otras técnicas 
de eliminación. 


9.3.1 División entre cero 


La razón principal por la que se le ha llamado simple al método anterior se debe a que durante las 
fases de eliminación y sustitución hacia atrás es posible que ocurra una división entre cero. Por 
ejemplo, si se utiliza el método de eliminación de Gauss simple para resolver 


2x7 + 3x3 =8 
Ax, + 6x» + 7x3 = 3 
2x+x2+6x3=5 


en la normalización del primer renglón habrá una división entre a,, = 0. También se pueden presen- 
tar problemas cuando un coeficiente está muy cercano a cero. La técnica de pivoteo se ha desarro- 
llado para evitar en forma parcial estos problemas. Esta se describe en la sección 9.4.2. 


9.3.2 Errores de redondeo 


Aun cuando la solución del ejemplo 9.5 fue cercana a la solución verdadera, existe una pequeña 
discrepancia en el resultado de xz [ecuación (E9.5.10)]. Esta diferencia, que corresponde a un error 
relativo del -0.00043%, se debe al uso de seis cifras significativas durante los cálculos. Si se hubie- 
sen utilizado más cifras significativas, el error en los resultados se habría reducido considerablemen- 
te. Si se hubiesen usado fracciones en lugar de decimales (y en consecuencia evitado los errores de 
redondeo), los resultados habrían sido exactos. Sin embargo, como las computadoras manejan sólo 
un número limitado de cifras significativas (recuerde la sección 3.4.1), es posible que ocurran erro- 
res de redondeo y se deben considerar al evaluar los resultados. 

El problema de los errores de redondeo llega a volverse particularmente importante cuando se 
trata de resolver un gran número de ecuaciones. Esto se debe al hecho de que cada resultado depen- 
de del anterior. Por consiguiente, un error en los primeros pasos tiende a propagarse, es decir, a 
causar errores en los siguientes pasos. 

Resulta complicado especificar el tamaño de los sistemas donde los errores de redondeo son 
significativos, ya que depende del tipo de computadora y de las propiedades de las ecuaciones. Una 
regla generalizada consiste en suponer que los errores de redondeo son de importancia cuando se 
trata de sistemas de 100 o más ecuaciones. En cualquier caso, siempre se deben sustituir los resul- 
tados en las ecuaciones originales y verificar si ha ocurrido un error sustancial. No obstante, como 
se verá más adelante, las magnitudes de los mismos coeficientes pueden influir en la aceptación de 
si una de estas pruebas de error asegura un resultado confiable. 


9.3.3 Sistemas mal condicionados 


Lo adecuado de una solución depende de la condición del sistema. En la sección 9.1.1 se desarrolló 
una representación gráfica de la condición de un sistema. Como se estudió en la sección 4.2.3, los 
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sistemas bien condicionados son aquellos en los que un pequeño cambio en uno o más coeficientes 
provoca un cambio similarmente pequeño en la solución. Los sistemas mal condicionados son 
aquellos en donde pequeños cambios en los coeficientes generan grandes cambios en la solución. 
Otra interpretación del mal condicionamiento es que un amplio rango de resultados puede satisfacer 
las ecuaciones en forma aproximada. Debido a que los errores de redondeo llegan a provocar peque- 
ños cambios en los coeficientes, estos cambios artificiales pueden generar grandes errores en la 
solución de sistemas mal condicionados, como se ilustra en el siguiente ejemplo. 


EJEMPLO 9.6 Sistemas mal condicionados 


Planteamiento del problema  Resuelva el siguiente sistema: 


112, +2=104 (E9.6.2) 


Después, resuélvalo de nuevo, pero con el coeficiente x, de la segunda ecuación modificado ligera- 
mente como 1.05. 


Solución Usando las ecuaciones (9.10) y (9.11), la solución es 


a 2(10)-2(10.4) y 
* 10)-2(1.1) 
Ñ 140.4) -1.100) =3 
2 10)-2(1.1) 

Sin embargo, con un ligero cambio al coeficiente a», de 1.1 a 1.05, el resultado cambia de forma drás- 
tica a 
_ 2(10)-2(10.4) 8 

12) -2(1.05) 
_ 1(10.4)-1.0500) _ 1 
12)-2(.05) 


1 


*, 


Observe que la razón principal de la discrepancia entre los dos resultados es que el denominador 
representa la diferencia de dos números casi iguales. Como se explicó previamente en la sección 
3.4.2, tales diferencias son altamente sensibles a pequeñas variaciones en los números empleados. 

En este punto, se podría sugerir que la sustitución de los resultados en las ecuaciones originales 
alertaría al lector respecto al problema. Por desgracia, con frecuencia éste no es el caso en sistemas 
mal condicionados. La sustitución de los valores erróneos x, = 8 y x,= 1 en las ecuaciones (E9.6.1) 
y (E9.6.2) resulta en 


8+2(1)=10=10 
1.1(8) +2(1) = 10.8 = 10.4 


Por lo tanto, aunque x, = 8 y x= l no sea la solución verdadera al problema original, la prueba de 
error es lo suficientemente cercana para quizá confundirlo y hacerle creer que las soluciones son las 
adecuadas. 


Como se hizo antes en la sección sobre métodos gráficos, es posible dar una representación 
visual del mal condicionamiento al graficar las ecuaciones (E9.6.1) y (E9.6.2) (recuerde la figura 
9.2). Debido a que las pendientes de las líneas son casi iguales, visualmente es difícil percibir con 
exactitud dónde se intersecan. Dicha dificultad visual se refleja en forma cuantitativa en los resul- 
tados ambiguos del ejemplo 9.6. Esta situación se puede caracterizar matemáticamente escribiendo 
las dos ecuaciones en su forma general: 


41%] + 4px,=b (9.24) 
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021%] + A977X) = b, (9.25) 


Dividiendo la ecuación (9.24) entre a, y la (9.25) entre a,,, y reordenando términos, se obtienen las 
versiones alternativas en el formato de líneas rectas [x, = (pendiente) x, + intercepto]: 


dns a BL 
qe 1 
4 4 
a b 
y, == iy q He 
da da 


Por consiguiente, si las pendientes son casi iguales 


41 _ 4 


4 4 
o, multiplicando en cruz, 
41147, S 412491 
lo cual se expresa también como 
41147, — 4124) =0 (9.26) 


Ahora, si recordamos que a;¡4,, — 41,4), es el determinante de un sistema bidimensional [ecua- 
ción (9.3)], se llega a la conclusión general de que un sistema mal condicionado es aquel en el que 
su determinante es cercano a cero. De hecho, si el determinante es exactamente igual a cero, las dos 
pendientes son idénticas, lo cual indica ya sea que no hay solución o que hay un número infinito de 
soluciones, como es el caso de los sistemas singulares ilustrados en las figuras 9.2a y 9.2b. 

Es difícil especificar qué tan cerca de cero debe estar el determinante de manera que indique un 
mal condicionamiento. Esto se complica por el hecho de que el determinante puede cambiar al mul- 
tiplicar una o más ecuaciones por un factor de escalamiento sin alterar la solución. Por consiguiente, 
el determinante es un valor relativo que se ve influenciado por la magnitud de los coeficientes. 


EJEMPLO 9.7 Efecto de escalamiento sobre el determinante 


Planteamiento del problema Evalúe el determinante de los siguientes sistemas: 


a) Del ejemplo 9.1: 


3x, + 2x, = 18 (E9.7.1) 

1, +2x,=2 (E9.7.2) 
b) Del ejemplo 9.6: 

x, +2x,=10 (E9.7.3) 

1.1x, +2x,= 10.4 (E9.7.4) 


c) Repita b), pero multiplique las ecuaciones por 10. 


Solución 

a) El determinante de las ecuaciones (E9.7.1) y (E.9.7.2) que están bien condicionadas, es 
D=30Q)-241)=8 

b) El determinante de las ecuaciones (E9.7.3) y (E9.7.4), que están mal condicionadas, es 
D=1(Q)-2(1.1) = -0.2 


c) Los resultados en a) y b) parecen corroborar el argumento de que los sistemas mal condicionados 
tienen determinantes cercanos a cero. Sin embargo, suponga que el sistema mal condicionado en 
b) se multiplica por 10, para obtener 
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10x, + 20x, = 100 
11x, + 20x, = 104 


La multiplicación de una ecuación por una constante no tiene efecto en su solución. Además, 
todavía está mal condicionada. Esto se verifica por el hecho de que multiplicar por una constante 
no tiene efecto en la solución gráfica. No obstante, el determinante se afecta en forma drástica: 


D=10(20) -20(11) = 20 


No sólo se han elevado en dos órdenes de magnitud, sino que ahora es más de dos veces el de- 
terminante del sistema bien condicionado en a). 


Como se ilustró en el ejemplo anterior, la magnitud de los coeficientes interpone un efecto de 
escalamiento, que complica la relación entre la condición del sistema y el tamaño del determinante. 
Una manera de evitar parcialmente esta dificultad es escalando las ecuaciones en forma tal que el 
elemento máximo en cualquier renglón sea igual a 1. 


EJEMPLO 9.8  Escalamiento 


Planteamiento del problema Escale los sistemas de ecuaciones del ejemplo 9.7 a un valor 
máximo de 1 y calcule de nuevo sus determinantes. 
Solución 

a) Para el sistema bien condicionado, el escalamiento resulta en 


x¡ + 0.667x,=6 
—0.5x, + x=l 


cuyo determinante es 
D=1(1) -0.667(-0.5) = 1.333 
b) Para el sistema mal condicionado, el escalamiento resulta en 


0.5x; +Xx= 5 
0.55x1 +xX,= 5.2 


cuyo determinante es 


D=0.5(1) —- 1(0.55) = -0.05 


c) En el último caso, al realizar los cambios del escalamiento, el sistema toma la misma forma que 
en b) y el determinante es también —0.05. De esta forma, se remueve el efecto de escalamiento. 


En una sección anterior (sección 9.1.2) se mencionó que el determinante es difícil de evaluar 
para más de tres ecuaciones simultáneas. Por lo tanto, podría parecer que no ofrece un recurso 
práctico para evaluar la condición de un sistema. Sin embargo, como se describe en el cuadro 9.1, 
existe un algoritmo simple que resulta de la eliminación de Gauss y que se puede usar para la eva- 
luación del determinante. 

Además del método usado en el ejemplo anterior existen otras formas para evaluar la condición 
del sistema. Por ejemplo, hay métodos alternativos para normalizar los elementos (véase Stark, 1970). 
Además, como se verá en el capítulo siguiente (sección 10.3), la matriz inversa y la norma de una 
matriz pueden usarse para evaluar la condición de un sistema. Por último, una prueba simple (pero que 
consume tiempo) consiste en modificar ligeramente los coeficientes y repetir la solución. Si tales 
modificaciones generan resultados drásticamente diferentes, es posible que el sistema esté mal condi- 
cionado. 
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Como se deduce del análisis anterior, los sistemas mal condicionados resultan problemáticos. 
Por fortuna, la mayoría de las ecuaciones algebraicas lineales, obtenidas de un problema de ingenie- 
ría, son por naturaleza bien condicionadas. Además, algunas de las técnicas presentadas en la sección 
9.4 ayudarán a reducir el problema. 


9.3.4 Sistemas singulares 


En la sección anterior se aprendió que una forma con la cual un sistema de ecuaciones puede estar 
mal condicionado es cuando dos o más de las ecuaciones son casi idénticas. Obviamente aún es peor 
cuando las dos son idénticas. En tales casos, se pierde un grado de libertad y se daría un caso impo- 
sible de n — 1 ecuaciones con n incógnitas. Tales casos podrían no ser obvios, en particular cuando 
se enfrenta con grandes sistemas de ecuaciones. En consecuencia, sería útil tener una forma de de- 
tectar la singularidad de manera automática. 

La respuesta a este problema está claramente dada por el hecho de que el determinante de un 
sistema singular es cero. Esta idea, a su vez, puede relacionarse con la eliminación gaussiana reco- 
nociendo que después del paso de eliminación, el determinante se evalúa como el producto de los 
elementos de la diagonal (recuerde el cuadro 9.1). Así, un algoritmo de computadora puede efectuar 
una prueba para discernir si se crea un cero en la diagonal durante la etapa de la eliminación. Si se 
descubre uno, el cálculo se puede terminar inmediatamente y en la pantalla aparecerá un mensaje 
de alerta. Se mostrarán más tarde, en este capítulo, los detalles de cómo se realiza esto cuando se 
presente el algoritmo completo de la eliminación de Gauss. 


9.4 TÉCNICAS PARA MEJORAR LAS SOLUCIONES 


Las siguientes técnicas se pueden incorporar al algoritmo de eliminación de Gauss simple, para 
evitar algunos de los problemas analizados en la sección previa. 


Cuadro 9.1 Evaluación de determinantes usando la eliminación de Gauss 


En la sección 9.1.2 se dijo que la evaluación de los determinantes por 
expansión de menores no resultaba práctico para grandes sistemas 
de ecuaciones. De esta forma, se concluyó que la regla de Cramer 
sólo es aplicable a sistemas pequeños. Sin embargo, como se men- 
cionó en la sección 9.3.3, el valor del determinante permite estimar 
la condición de un sistema. Por lo tanto, será útil tener un método 
práctico para calcular esta cantidad. 

Por fortuna, la eliminación gaussiana proporciona una forma 
simple para hacerlo. El método se basa en el hecho de que el deter- 
minante de una matriz triangular se puede calcular de forma simple, 
como el producto de los elementos de su diagonal: 

(C9.1.1) 


D= 411422433 ... Gn 


La validez de esta formulación se ilustra para un sistema de 3 por 3: 


4; 4) 43 
D=|0 a, a, 
0 0. a, 


donde el determinante se evalúa como [recuerde la ecuación (9.4)] 


4 Az 


D=a, 


33 
o evaluando los menores (es decir, los determinantes 2 por 2) 


D= a,,4,,4,, — 4,,(0)+a,,(0) = a,4,4y, 


Recuerde que el paso de eliminación hacia adelante de la elimi- 
nación de Gauss genera un sistema triangular superior. Puesto que 
el valor del determinante no cambia con el proceso de eliminación 
hacia adelante, simplemente el determinante se evalúa al final de este 
paso por medio de 
(n—1) 


q 


D= 4,4343, *** Qi (C9.1.2) 
donde los superíndices indican el número de veces que los elemen- 
tos han sido modificados en el proceso de eliminación. Por lo 
tanto, es posible aprovechar el esfuerzo que se ha logrado al redu- 
cir el sistema a su forma triangular, y obtener un cálculo simple del 
determinante. 

Hay una ligera modificación al método anterior cuando el progra- 
ma usa pivoteo parcial (la sección 9.4.2). En este caso, el determinante 
cambia de signo cada vez que un renglón es pivoteado. Una manera 
de representar esto es modificando la ecuación (C9.1.2): 

D=a, a ax ao (y (C9.1.3) 
donde p representa el número de veces en que los renglones se pivo- 
tean. Esta modificación se puede incorporar de forma simple en un 
programa; únicamente rastree el número de pivoteos que se llevan a 
cabo durante el transcurso de los cálculos y después use la ecuación 
(C9.1.3) para evaluar el determinante. 


9,4 Técnicas para mejorar las soluciones 


9.4.1 Uso de más cifras significativas 


El remedio más simple para el mal condicionamiento consiste en emplear más cifras significativas 
en los cálculos. Si la computadora tiene la capacidad para usar más cifras, esta característica redu- 
cirá enormemente el problema. No obstante, el precio que hay que pagar en cálculo y memoria se 
eleva con el uso de la precisión extendida (recuerde la sección 3.4.1). 


9.4.2 Pivoteo 


Como se mencionó al inicio de la sección 9.3, ocurren problemas obvios cuando un elemento pivote 
es cero, ya que el paso de normalización origina una división entre cero. También llegan a surgir 
problemas cuando el elemento pivote es cercano a —o más aún que sea exactamente igual a— cero, 
debido a que si la magnitud del elemento pivote es pequeña comparada con los otros elementos, 
entonces se pueden introducir errores de redondeo. 

Por lo tanto, antes de normalizar cada renglón, resulta conveniente determinar el coeficiente 
más grande disponible en la columna debajo del elemento pivote. Los renglones se pueden intercam- 
biar de manera que el elemento más grande sea el elemento pivote; esto se conoce como pivoteo 
parcial. Al procedimiento, donde tanto en las columnas como en los renglones se busca el elemento 
más grande y luego se intercambian, se le conoce como pivoteo completo, el cual se usa en muy 
raras ocasiones debido a que al intercambiar columnas se cambia el orden de las x y, en consecuen- 
cia, se agrega complejidad significativa y usualmente injustificada al programa de computadora. El 
siguiente ejemplo ilustra las ventajas del pivoteo parcial. Además de evitar la división entre cero, el 
pivoteo también minimiza el error de redondeo. Como tal, sirve también para resolver parcialmente 
el mal condicionamiento. 


EJEMPLO 9.9 Pivoteo parcial 


Planteamiento del problema Emplee la eliminación de Gauss para resolver 


0.0003x, + 3.0000x, = 2.0001 
1.0000x, + 1.0000x, = 1.0000 


Observe que en esta forma el primer elemento pivote, a,, = 0.0003, es muy cercano a cero. Entonces 
haga de nuevo el cálculo, pero ahora con pivoteo parcial, invirtiendo el orden de las ecuaciones. La 
solución exacta es x, = 1/3 y x, = 2/3. 


Solución Multiplicando la primera ecuación por 1/(0.0003) da como resultado 
x¡ + 10000x, = 6667 

lo cual se utiliza para eliminar x, de la segunda ecuación: 
-9999x, =-6666 


de donde se despeja 


Este resultado se sustituye en la primera ecuación para evaluar x;: 


_ 2.0001-3(2 /3) 
0.0003 


: (E9.9.1) 


Sin embargo, debido a la cancelación por resta, el resultado es muy sensible al número de cifras 
significativas empleadas en el cálculo: 
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Valor absoluto del error 


Cifras significativas X X1 relativo porcentual para Xx; 
3 0.667 -=3.33 1099 
4 0.6667 0.0000 100 
5 0.66667 0.30000 10 
6 0.666667 0.330000 1 
7 0.6666667 


0.3330000 0.1 


Observe cómo el valor de x, depende en gran medida del número de cifras significativas. Esto se 
debe a que en la ecuación (E9.9.1) se restan dos números casi iguales. Por otro lado, si se resuelven 
las ecuaciones en orden inverso, se normaliza el renglón con el elemento pivote más grande. Las 
ecuaciones son 


1.0000x, + 1.0000x, = 1.0000 
0.0003x, + 3.0000x, = 2.0001 
La eliminación y la sustitución dan x, = 2/3. Con diferentes números de cifras significativas, x, se 
puede calcular de la primera ecuación, así 
y= A 3) 


Este caso es mucho menos sensible al número de cifras significativas usadas en el cálculo: 


(E9.9.2) 


Valor absoluto del error 


Cifras significativas * X1 relativo porcentual para Xx; 
3 0.667 0.333 0.1 
4 0.6667 0,3333 0.01 
5 0.66667 0,33333 0.001 
6 0.666667 0,333333 0.0001 
7 0.6666667 0.3333333 0.00001 


Por lo que la estrategia de pivoteo es mucho más satisfactoria. 


p= kk 

big = laz] 

DOFOR 11 = k+1, n 
dummy = |a;; x| 
IF (dummy > big) 

big = dummy 
D= TT 

END IF 

END DO 

IF (p A Kk) 

DOFOR jj = k, n 
dummy = ap 5; 
dojs E Ok 
dx = dummy 

END DO 

dummy = b, 

D» => Di 

b, = dummy 

END IF 

Figura 9.5 


Pseudocódigo para 
implementar el pivoteo 
parcial. 


Los programas computacionales de uso general deben tener una estrategia de pivoteo. En la fi- 
gura 9.5 se proporciona un algoritmo simple para llevar a cabo dicha estrategia. Observe que el al- 
goritmo consiste en dos grandes ciclos. Luego de guardar el elemento pivote actual y su número de 
renglón como las variables big y p, el primer ciclo compara el elemento pivote con los elementos que 
se hallan debajo de él, para verificar si algunos de ellos es mayor que el elemento pivote. Si es así, 
el nuevo elemento más grande y su número de renglón se guardan en big y p. Después, el segundo 
ciclo intercambia el renglón del pivote original con el del elemento más grande, de tal forma que el 
último sea el nuevo renglón pivote. Este pseudocódigo puede agregarse a un programa basado en los 
otros elementos de la eliminación de Gauss mostrados en la figura 9.4. La mejor forma de hacerlo 
consiste en emplear un método modular y escribir la figura 9.5 como una subrutina (o procedimien- 
to), que pueda llamarse directamente después del inicio del primer ciclo en la figura 9.4a. 

Observe que la segunda instrucción IF/THEN de la figura 9.5 intercambia físicamente los ren- 
glones. Con grandes matrices, esto llevaría mucho tiempo. En consecuencia, de hecho, la mayoría 
de los códigos no intercambian renglones sino llevan un registro de cuál es el renglón pivote, guar- 
dando los subíndices apropiados en un vector. Este vector proporciona luego una base para especi- 
ficar el orden adecuado de los renglones durante la eliminación hacia adelante y las operaciones de 
sustitución hacia atrás. Así, se dice que las operaciones se implementan in situ. 


9.4.3 Escalamiento 


En la sección 9.3.3 se mencionó que el escalamiento podía ser útil para la estandarización del tama- 
ño determinante. Más allá de esta aplicación, tiene utilidad en la minimización de los errores de 


9.4 Técnicas para mejorar las soluciones 


redondeo, en aquellos casos en los que algunas de las ecuaciones de un sistema tienen coeficientes 
mucho más grandes que otros. Tales situaciones se encuentran con frecuencia en la práctica de la 
ingeniería, al usar unidades muy diferentes en el desarrollo de ecuaciones simultáneas. Por ejemplo, 
en problemas de circuitos eléctricos, los voltajes desconocidos se pueden expresar en unidades que 
varían desde microvoltios hasta kilovoltios. Existen ejemplos similares en todos los campos de la 
ingeniería. Mientras cada una de las ecuaciones sea consistente, el sistema será técnicamente correc- 
to y susceptible de ser resuelto. Sin embargo, el uso de unidades tan diversas puede llevar a que los 
coeficientes difieran ampliamente en magnitud. Esto, a su vez, puede tener un impacto sobre el error 
de redondeo, ya que afecta el pivoteo, como se ilustra en el siguiente ejemplo. 


EJEMPLO 9.10 Efecto del escalamiento sobre el pivoteo y el redondeo 


Planteamiento del problema 


a) Resuelva el siguiente sistema de ecuaciones usando la eliminación de Gauss y una estrategia de 


pivoteo: 
2x, + 100000x, = 100000 
x + x=2 


b) Repita el problema después de escalar las ecuaciones de tal forma que el coeficiente máximo en 
cada renglón sea 1. 

c) Finalmente, utilice los coeficientes escalados para determinar si el pivoteo es necesario. No 
obstante, resuelva las ecuaciones con los valores de los coeficientes originales. En todos los 
casos, conserve sólo tres cifras significativas. Observe que las respuestas correctas son x, = 
1.00002 y x, = 0.99998 o, para tres cifras significativas, x, = x, = 1.00. 


Solución 


a) Sin escalar, se aplica la eliminación hacia adelante y se obtiene 


2x, + 100 000x, = 100 000 
50 000x, = -50 000 


que se puede resolver por sustitución hacia atrás: 
x, = 1.00 
x¡ =0.00 
Aunque x, es correcta, x, tiene un 100% de error debido al redondeo. 
b) El escalamiento transforma las ecuaciones originales en 
0.00002x; + x, = 1 
x+x=2 
Por lo tanto, se deben pivotear los renglones y colocar el valor más grande sobre la diagonal. 
xXx +x=2 
0.00002x, +x,= 1 
La eliminación hacia adelante da como resultado 
x +x,=2 
x,= 1.00 
de donde se obtiene 
x=x,=1 
De esta forma, el escalamiento conduce a la respuesta correcta. 


c) Los coeficientes escalados revelan que es necesario el pivoteo. Por lo tanto, se pivotea pero se 
mantienen los coeficientes originales para obtener 
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x + x=2 
2x, + 100 000x, = 100 000 


La eliminación hacia adelante da como resultado 


x + x=2 


100 000x, = 100 000 


que al resolverse se obtiene la respuesta correcta: x, = x,= 1. Entonces, el escalamiento fue útil 
para determinar si el pivoteo era necesario; aunque las ecuaciones por sí mismas no requieren 
escalarse para llegar a un resultado correcto. 


Al igual que en el ejemplo anterior, el escalamiento es útil para minimizar los errores de redon- 
deo. Sin embargo, se debe advertir que el propio escalamiento lleva también a errores de redondeo. 
Por ejemplo, dada la ecuación 


2x¡ + 300000x, = 1 
y usando tres cifras significativas, escalando se obtiene 
0.00000667x, + x, = 0.00000333 


De esta forma, el escalamiento introduce un error de redondeo en el primer coeficiente y en la cons- 
tante del lado derecho. Por esta razón, algunas veces se sugiere que el escalamiento se emplee única- 
mente como en el inciso c) del ejemplo anterior. Esto es, se usa para calcular valores escalados de los 
coeficientes sólo como un criterio de pivoteo; pero los valores de los coeficientes originales se con- 
servan para los cálculos reales de eliminación y sustitución. Esto tiene ventajas y desventajas si el 
determinante se calcula como parte del programa. Es decir, el determinante resultante no será esca- 
lado. Sin embargo, como muchas aplicaciones de la eliminación de Gauss no requieren la evaluación 
del determinante, es el planteamiento más común y se usará en el algoritmo de la siguiente sección. 


9.4.4 Algoritmo para la eliminación gaussiana 


Los algoritmos de las figuras 9.4 y 9.5 se combinan ahora en un solo algoritmo para implementar el 
algoritmo completo de la eliminación de Gauss. En la figura 9.6 se muestra el algoritmo de una sub- 
rutina general para realizar la eliminación de Gauss. 

Observe que el programa tiene módulos para las tres operaciones principales del algoritmo de 
eliminación gaussiana: eliminación hacia adelante, sustitución hacia atrás y pivoteo. Además, hay 
varios aspectos del código que difieren y representan un mejoramiento de los pseudocódigos de las 
figuras 9.4 y 9.5. Éstos son: 


+ Las ecuaciones no están escaladas, pero los valores escalados de los elementos se usan para 
determinar si se debe usar el pivoteo. 

+ El término diagonal se vigila durante la fase del pivoteo para detectar ocurrencias de valores 
cercanos a cero y con esto indicar si el sistema es singular. Si devuelve un valor de er = —1, se 
ha detectado una matriz singular y el cálculo debe terminar. El usuario da a un parámetro tol, un 
número pequeño para detectar ocurrencias cercanas a cero. 


EJEMPLO 9.11 Solución de ecuaciones algebraicas lineales por medio 
de la computadora 


Planteamiento del problema Un programa de computadora para resolver ecuaciones algebrai- 
cas lineales, como por ejemplo en el que se basa la figura 9.6, sirve para resolver un problema rela- 
cionado con el ejemplo de la caída del paracaidista, analizado en el capítulo 1. Suponga que un 
equipo de tres paracaidistas está unido por una cuerda ligera mientras va en caída libre a una velo- 
cidad de 5 m/s (figura 9.7). Calcule la tensión en cada sección de la cuerda y la aceleración del 
equipo, dados los siguientes datos: 


9.4 Técnicas para mejorar las soluciones 


Paracaidista Masa, kg Coeficiente de arrastre, kg/s 
1 70 10 
60 14 
3 40 17 


Solución Los diagramas de cuerpo libre para cada paracaidista se muestran en la figura 9.8. Su- 
mando las fuerzas en la dirección vertical y utilizando la segunda ley de Newton se obtiene un sis- 


tema de tres ecuaciones lineales simultáneas: 
mig = T-—cyu =m,a 
m8 + T-czv—R=m,a 


M38 -Cc3U+R=m3a 


Estas ecuaciones tienen tres incógnitas: a, T y R. Después de sustituir los valores conocidos, las 
ecuaciones se pueden expresar en forma matricial como (g = 9.8 m/s?), 


SUB Gauss (a, b, n, x, tol, er) 
DIMENSION s (n) 
er= 0 
DOFOR ¡= 1, n 
Sy = ABS(a; 1) 
DOFOR j= 2, n 
IF ABS(a; ¿)>S; THEN s; = ABS(a; ;) 
END DO 
END DO 
CALL Eliminate(a, S, n, b, tol, er) 
IF er z —1 THEN 
CALL Substitute(la, n, b, x) 
END IF 
END Gauss 


SUB Eliminate (a, Ss, n, b, tol, er) 
DOFOR k= 1, n= 1 
CALL Pivot (a, b, S, n, k) 
IF ABS (ax. /si) < tol THEN 


er=-—] 
EXIT DO 
END IF 


DOFOR ¡=k+ 1, n 
factor = as 1/0 
DOFOR j=k+l, n 
dj = di 7 factor*a, ; 
END DO 
bi; = b, - factor * D, 
END DO 
END DO 
IF ABS(apn/Sp) < tol THEN er = —1 
END Eliminate 


Figura 9.6 


SUB Pivot (a, b, Ss, n, k) 
p=k 
big = ABS(as ;/S;) 
DOFOR ¡i¡=k+w* 1, n 
dummy = ABS(a;; x/S;;) 
IF dummy > big THEN 
big = dummy 
p= 11 
END IF 
END DO 
IF px k THEN 
DOFOR Jj= k, n 
dummy = ap 5; 


dois E Oj 
dx; = dummy 
END DO 
dummy = bp 
Dp = Ds 
b, = dummy 
dummy = S) 
Sp = Sk 
Si = dummy 
END IF 
END pivot 


SUB Substitute (a, n, b, Xx) 
Xn = Dp/ an, 
DOFOR ¡=nm-1, 1, 
sum= 0 
DOFOR j= 1+1,n 
sum = Sum + dj; * X 
END DO 
Xn = (D, = Sum) / app 
END DO 
END Substitute 


j 


Pseudocódigo para instaurar la eliminación de Gauss con pivoteo parcial. 


211 


212 


Figura 9.7 

Tres paracaidistas en 
caída libre unidos por 
cuerdas sin peso. 
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7 1 0HJja 636.7 
60 -1 1 [7/=3518.6 
40 0 —-1||2 307.4 


Este sistema se puede resolver usando sus propios programas. El resultado es a = 8.6041 m/s?, T = 
34.4118 N y R= 36/7647 N. 


Figura 9.8 
Diagramas de cuerpo libre para cada uno de los tres paracaidistas en caída. 


9.5 SISTEMAS COMPLEJOS 


En algunos problemas es posible obtener un sistema de ecuaciones complejas 

[CHZ) = (W) (9.27) 
donde 

[C] = [4] + :[B] 

(2) = (9 +4Y) 

[W) = (U) + ¿[V) (9.28) 


donde ¡=/-1. 


El camino más directo para resolver un sistema como éste consiste en emplear uno de los algo- 
ritmos descritos en esta parte del libro; pero sustituyendo todas las operaciones reales por complejas. 
Claro que esto sólo es posible con aquellos lenguajes, como el Fortran, que permiten el uso de va- 
riables complejas. 

Para lenguajes que no permiten la declaración de variables complejas, es posible escribir un 
código que convierta operaciones reales en complejas. Sin embargo, esto no es una tarea trivial. Una 
alternativa es convertir el sistema complejo en uno equivalente que trabaje con variables reales. Esto 
se logra al sustituir la ecuación (9.28) en la (9.27) e igualar las partes real y compleja de la ecuación 
resultante, para obtener 


9.6 Sistemas de ecuaciones no lineales 


[AN(X) — [B10Y) = (0) (9.29) 


[BHX) + (ANY) = (1) (9.30) 


Así, el sistema de n ecuaciones complejas se convierte en un conjunto de 2n ecuaciones reales. 
Esto significa que el tiempo de almacenamiento y de ejecución se incrementará en forma significa- 
tiva. En consecuencia, habrá que evaluar las ventajas y desventajas de esta opción. Si es poco fre- 
cuente que se evalúen sistemas complejos, es preferible usar las ecuaciones (9.29) y (9.30) por su 
conveniencia. Sin embargo, si se usan con frecuencia y desea utilizar un lenguaje que no permite el 
uso de datos de tipo complejo, quizá valga la pena escribir un programa que convierta operaciones 
reales en complejas. 


9.6 SISTEMAS DE ECUACIONES NO LINEALES 


Recuerde que al final del capítulo 6 se expuso un procedimiento para resolver dos ecuaciones no 
lineales con dos incógnitas. Este se puede extender al caso general para resolver n ecuaciones no li- 
neales simultáneas. 


fi 01, Xac. Xy) =0 
Pr, Mar... Xn) =0 


(9.31) 


Fi 001 Xo, -.., Xp) =0 


La solución de este sistema consiste en un conjunto de valores x que hacen todas las ecuaciones igual 
a Cero. 

Como se describió en la sección 6.5.2, un procedimiento para resolver tales sistemas se basa en 
la versión multidimensional del método de Newton-Raphson. Así, se escribe para cada ecuación una 
expansión de la serie de Taylor. Por ejemplo, para la k-ésima ecuación, 


e, a, 


O) 9 = a E 3 
X, X, 


Fei E Fei + Cris = X,:) (9.32) 


donde el primer subíndice, k, representa la ecuación o la incógnita, y el segundo subíndice denota si 
el valor de la función en cuestión es el presente (1) o el siguiente (1 + 1). 

Las ecuaciones de la forma (9.32) son escritas para cada una de las ecuaciones no lineales ori- 
ginales. Después, como se hizo al obtener la ecuación (6.20) a partir de la (6.19), todos los términos 
Fis 1 Se igualan a cero, como sería el caso en la raíz, y la ecuación (9.32) se escribe como 


e E 7 
Fei FX > +X; dl Fo dx, 

e e e 
Ia TS Dx, (9.33) 


Observe que las únicas incógnitas en la ecuación (9.33) son los términos xy; , ¡ del lado derecho. 
Todas las otras cantidades tienen su valor presente (1) y, por lo tanto, son conocidas en cualquier 
iteración. En consecuencia, el sistema de ecuaciones representado, en general, por la ecuación (9.33) 
(es decir, con k= 1, 2, ..., n) constituye un sistema de ecuaciones lineales simultáneas que se pueden 
resolver con los métodos analizados en esta parte del libro. 

Se puede emplear la notación matricial para expresar la ecuación (9.33) en forma concisa. Las 
derivadas parciales se expresan como 
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d11 A d13 b, 
a dz da: b, 
SE Ad E b, | 
da 
M1 o 0:¿bP] 
0 0 pr 
De 
di 
Xx == 
Xx, =/07 
2 = lo 
Figura 9.9 


Ilustración del método 
Gauss-Jordan. Com- 
pare con la figura 9.3 
para dilucidar las dife- 
rencias entre esta téc- 
nica y la eliminación de 
Gauss. El superíndice 
n significa que los ele- 
mentos del vector del 
lado derecho se han 
modificado n veces 
(para este caso, n = 3). 
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O | 
Ox,  0x, 0X, 
a a a 
Ox,  0x, 0x, 
[2=| +: 
(9.34) 
a ae a. 
| de dx, 0x, 
Los valores inicial y final se expresan en forma vectorial como 
Xy= Lx; Xi co 
y 
ad Ls Y i+1 Aral 
Finalmente, los valores de la función en ¡ se pueden expresar como 
yr=LA, La; fui) 
Usando estas relaciones, la ecuación (9.33) se representa en forma concisa como 
[Z1X;, 1) = 08) +IZMX) (9.35) 


La ecuación (9.35) se resuelve usando una técnica como la eliminación de Gauss. Este proceso se 
repite iterativamente para obtener una aproximación refinada de forma similar al caso de dos ecua- 
ciones como en la sección 6.3.2. 

Se debe notar que el procedimiento anterior tiene dos desventajas importantes. Primero, a menu- 
do no es fácil evaluar la ecuación (9.34). Por lo que se ha desarrollado una variación del método de 
Newton-Raphson para evitar tal problema. Como podría esperarse, tal variación se basa en el uso 
de aproximaciones por diferencias finitas, para calcular las derivadas parciales que aparecen en [Z]. 

La segunda desventaja del método de Newton-Raphson para multiecuaciones es que usualmen- 
te se requiere de excelentes valores iniciales para asegurar la convergencia. Ya que con frecuencia 
esto es difícil de obtener, se han desarrollado métodos alternos que, aunque son más lentos que el 
método de Newton-Raphson, dan un mejor comportamiento de convergencia. Un método común es 
reformular el sistema no lineal como una sola función 


» 

HS y ol 
i=1 

donde f¡(x¡, Xx», ..., x,) es el ¡-ésimo miembro del sistema original de la ecuación (9.31). Los valores 

de x que minimizan esta función representan también la solución del sistema no lineal. Como se verá 

en el capítulo 17, esta reformulación pertenece a una clase de problemas llamados regresión no lineal. 

Como tal, se puede abordar con varias técnicas de optimización como las que se describirán más 

adelante en este texto (parte cuatro, específicamente en el capítulo 14). 


(9.36) 


9.7 GAUSS-JORDAN 


El método de Gauss-Jordan es una variación de la eliminación de Gauss. La principal diferencia 
consiste en que cuando una incógnita se elimina en el método de Gauss-Jordan, ésta es eliminada 
de todas las otras ecuaciones, no sólo de las subsecuentes. Además, todos los renglones se normali- 
zan al dividirlos entre su elemento pivote. De esta forma, el paso de eliminación genera una matriz 
identidad en vez de una triangular (figura 9.9). En consecuencia, no es necesario usar la sustitución 
hacia atrás para obtener la solución. El método se ilustra mejor con un ejemplo. 


9.7 Gauss-Jordan 


EJEMPLO 9.12 Método de Gauss-Jordan 


Planteamiento del problema Conla técnica de Gauss-Jordan resuelva el sistema del ejemplo 9.5: 


3x, — 0.1x, — 0.2x3 = 7.85 
0.1x, + 7x, — 0.3x3 = 19.3 
0.3x, — 0.2x, + 10x3 =71.4 


Solución Primero, exprese los coeficientes y el lado derecho como una matriz aumentada: 


3 01 02 7.85 
0.1 7  -03 -193 
0.3 0.2 10 71.4 


Luego normalice el primer renglón, dividiéndolo entre el elemento pivote, 3, para obtener 


1  -0.0333333 -0.066667 2.61667 
0.1 7 0.3 -19.3 
0.3 0.2 10 71.4 


El término x, se elimina del segundo renglón restando 0.1 veces al primer renglón del segundo. En 
forma similar, restando 0.3 veces el primer renglón del tercero, se eliminará el término x, del tercer 
renglón: 

1 -0.0333333 -—0.066667  2.61667 

O  7.00333  -0.293333 -19.5617 

O -—0.190000  10.0200  70.6150 


En seguida, se normaliza el segundo renglón dividiéndolo entre 7.00333: 


1 -0.0333333 -—0.066667  2.61667 
0 1 —0.0418848 -2.79320 
O  -—0.190000 10.0200 70.6150 


Al reducir los términos x» de las ecuaciones primera y tercera se obtiene 


1 0 -0.0680629 2.52356 
O 1 -—0.0418848 -2.79320 
0 0 10.01200  70.0843 


El tercer renglón se normaliza después al dividirlo entre 10.0120: 


1 0 -0.0680629 2.52356 
O 1 -—0.0418848 -2.79320 
0.0 1 7.0000 


Por último, los términos x3 se pueden eliminar de la primera y segunda ecuación para obtener 
10 0. 3.0000 
0 1 0 -2,5000 
0 0 1 7.0000 
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De esta forma, como se muestra en la figura 9.9, la matriz de coeficientes se ha transformado en la 
matriz identidad, y la solución se obtiene en el vector del lado derecho. Observe que no se requiere 
la sustitución hacia atrás para llegar a la solución. 


Todo el material en este capítulo respecto a los escollos y las mejoras en la eliminación de Gauss 
también se aplica al método Gauss-Jordan. Por ejemplo, se puede usar una estrategia de pivoteo si- 
milar para evitar la división entre cero y para reducir el error de redondeo. 

Aunque la técnica de Gauss-Jordan y la eliminación de Gauss podrían parecer casi idénticas, la 
primera requiere más trabajo. Con el empleo de un enfoque similar al de la sección 9.2.1, se deter- 
mina que el número de flops que se involucra en la técnica de Gauss-Jordan simple es 


conforme n 
aumenta 


n+n-n n+0(m) (9.37) 
Así, la técnica de Gauss-Jordan involucra aproximadamente 50% más operaciones que la eliminación 
de Gauss [compárese con la ecuación (9.23)]. Por lo tanto, la eliminación de Gauss es el método de 
eliminación sencilla que se prefiere para obtener las soluciones de ecuaciones algebraicas lineales. 
Sin embargo, una de las razones principales por las que se ha introducido la técnica de Gauss-Jordan, 
es que aún se utiliza tanto en la ingeniería como en ciertos algoritmos numéricos. 


9.8 RESUMEN 


En resumen, se ha dedicado la mayor parte de este capítulo a la eliminación de Gauss: el método 
fundamental para resolver ecuaciones algebraicas lineales simultáneas. Aunque es una de las técni- 
cas más antiguas concebidas para este propósito, sin embargo, es un algoritmo efectivo en extremo 
para obtener las soluciones de muchos problemas en ingeniería. Además de esta utilidad práctica, 
este capítulo proporciona un contexto para el análisis de puntos generales, como el redondeo, el 
escalamiento y el condicionamiento. Se presentó también, en forma breve, material sobre el método 
de Gauss-Jordan, así como sobre sistemas complejos y no lineales. 

Los resultados obtenidos al usar la eliminación de Gauss se pueden verificar al sustituirlos en 
las ecuaciones originales. No obstante, realizarlo no siempre representa una prueba confiable para 
sistemas mal condicionados. Por ello debe efectuarse alguna medida de la condición, como el deter- 
minante de un sistema escalado, si se tiene idea de que haya un error de redondeo. Dos opciones para 
disminuir el error de redondeo son el pivoteo parcial y el uso de un mayor número de cifras signifi- 
cativas en los cálculos. En el siguiente capítulo se regresará al tema de la condición del sistema 
cuando se analice la matriz inversa. 


PROBLEMAS 
9.1 3 
a) Escriba en forma matricial el conjunto siguiente de ecuaciones: (0) =36 [D] = ls A AO 
a AI 
8 =6x3 +2x, 1 
2-X1=X3 1.5 8 
Sx,+8x,=13 E 
4.00 6 
b) Multiplique la matriz de coeficientes por su transpuesta; es decir 3.01 
[A] [4]7. [F] = É , A [G|=17 6 4] 


9.2 Ciertas matrices están definidas como sigue 


En relación con estas matrices responda las preguntas siguientes: 
E e a) ¿Cuáles son las dimensiones de las matrices? 
[4] =| 1 2 [B]=|1 2 7 b) Identifique las matrices cuadrada, columna y renglón. 
5 6 2.0 4 c) ¿Cuáles son los valores de los elementos a», b33, dx2, €22,£12 Y 212? 


d) Ejecute las operaciones siguientes: 


1) [£] + [8] 7) [B] x [4] 
2) [4] + [F] 8) [DJ” 
3) [B] - [El 9) [4] x (C) 
4)7x[B] 10) [1 x[B] 
5) [El x[B] 11) [EY [£] 
6) (Cy 12) (CC) 
9.3 Tres matrices se definen como 
[A] = , lo em | 2] pc1= |? Fd 
N 105 2 ol-3 1 
7 4 


a) Ejecute todas las multiplicaciones que sea posible calcular entre 
parejas de las matrices. 
b) Utilice el método del cuadro PT3.2 para justificar por qué no se 
puede multiplicar a las demás parejas. 
c) Emplee los resultados del inciso a) para ilustrar por qué es 
importante el orden de la multiplicación. 
9.4 Use el método gráfico para resolver 


4x; - 8x, = 24 
—=x¡ + 6x, = 34 
Verifique sus resultados sustituyéndolos nuevamente en las ecua- 


ciones. 
9.5 Dado el sistema de ecuaciones 


-1.1x, + 10x,= 120 
-2x, + 17.4x,= 174 


a) Resuélvalo gráficamente y compruebe el resultado con la sus- 
titución en las ecuaciones. 
b) Sobre la base de la solución gráfica, ¿qué se espera con respecto 
de la condición del sistema? 
c) Calcule el determinante. 
d) Resuelva por medio de la eliminación de incógnitas. 
9.6 Para el sistema de ecuaciones que sigue 
2x,+5x3=9 
2x1 +x2+:3=9 
3x1 +x,=10 
a) Calcule el determinante. 
b) Use la regla de Cramer para encontrar cuál es el valor de las x. 
c) Sustituya el resultado en las ecuaciones originales para efectos 
de comprobación. 
9.7 Dadas las ecuaciones 


0.5x¡ — x,=-9.5 
1.02x, — 2x, = 18.8 


a) Resuelva en forma gráfica. 
b) Calcule el determinante. 
c) Con base en los incisos a) y b), ¿qué es de esperarse con respecto 
de la condición del sistema? 
d) Resuelva por medio de la eliminación de incógnitas. 
e) Resuelva otra vez, pero modifique ligeramente el elemento a; 
a 0.52. Interprete sus resultados. 
9.8 Dadas las ecuaciones siguientes 


10x, + 2x, — x3 = 27 
3x, — 6x, + 2x3 = 61.5 
Xx +x, + 5x3 = 21.5 
a) Resuelva por eliminación de Gauss simple. Efectúe todos los 
pasos del cálculo. 
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b) Sustituya los resultados en las ecuaciones originales a fin de 
comprobar sus respuestas. 
9.9 Use la eliminación de Gauss para resolver: 
8x¡ + 2x, — 2x3 =-2 
10x, + 2x,+ 4x3 =4 
12x, +2x, + 2x3=6 
Emplee pivoteo parcial y compruebe las respuestas sustituyéndolas 


en las ecuaciones originales. 
9.10 Dado el sistema siguiente de ecuaciones 


3x2 + 7x3 = 2 
x1+2x,-x3=3 
Sx¡ —- 2x2 =2 


a) Calcule el determinante. 
b) Use la regla de Cramer para encontrar cuáles son los valores de 
las x. 
c) Emplee la eliminación de Gauss con pivoteo parcial para obtener 
cuáles serían los valores de las x. 
d) Sustituya sus resultados en las ecuaciones originales para efectos 
de comprobación. 
9.11 Dadas las ecuaciones 
2x, — 6x, — x3 =-38 
3x1 — M2 + 7x3 =-34 
-8x, + x, — 2x3 = -20 
a) Resuelva por eliminación de Gauss con pivoteo parcial. Efectúe 
todos los pasos del cálculo. 
b) Sustituya los resultados en las ecuaciones originales para com- 
probar sus respuestas. 
9.12 Emplee la eliminación de Gauss-Jordan para resolver el sistema 
siguiente: 
2x,+x,-x3=1 
Sx¡ + 2x,+2x3= 4 
3x1+x2+x3=5 
No utilice pivoteo. Compruebe sus respuestas con la sustitución en 
las ecuaciones originales. 
9.13 Resuelva el sistema: 
Xx +x-%x=-3 
6x, + 2x, + 2x3 =2 
—3x, +4x,+x3=1 
por medio de a) eliminación de Gauss simple, b) eliminación de Gauss 
con pivoteo parcial y c) método de Gauss-Jordan sin pivoteo parcial. 


9.14 Lleve a cabo el mismo cálculo que en el ejemplo 9.11, pero use 
cinco paracaidistas con las características siguientes: 


Coeficiente 
Paracaidista Masa, kg de arrastre, kg/s 
1 55 10 
2 75 12 
3 60 15 
4 15 16 
5 90 10 


Los paracaidistas tienen una velocidad de 9 m/s. 
9.15 Resuelva el sistema 
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9.16 Desarrolle, depure y pruebe un programa en cualquier lengua- 
je de alto nivel o de macros de su predilección, para multiplicar dos 
matrices; es decir, [X] = [Y] [Z], donde [Y] es de orden m por n y [Z] 
es de n por p. Pruebe el programa con el empleo de las matrices del 
problema 9.3. 

9.17 Desarrolle, depure y pruebe un programa en cualquier lengua- 
je de alto nivel o de macros que prefiera, para generar la transpuesta 
de una matriz. Pruébelo con las matrices del problema 9.3. 

9.18 Desarrolle, depure y pruebe un programa en el lenguaje de alto 
nivel o de macros que prefiera, para resolver un sistema de ecuacio- 
nes por medio de la eliminación de Gauss con pivoteo parcial. Base 
su programa en el pseudocódigo de la figura 9.6. Pruébelo con el uso 
del sistema siguiente (cuya respuesta es x, = Xx, =x3= 1), 


x +2x,-x,=2 
S5x, +2x,+2x,=9 


3x1, +5x,-x,=1 


9.19 Tres masas están suspendidas verticalmente por una serie de 
resortes idénticos donde la masa 1 está en la parte superior y la masa 
3 está en la parte inferior. Si g = 9.81 m/s?, m, = 2 kg, m,=3 kg, m3 = 
2.5 kg y las k= 10 kg/s?, despeje los desplazamientos x. 

9.20 Desarrolle, depure y pruebe un programa ya sea en lenguaje de 
alto nivel o en el macrolenguaje de su elección para resolver un sis- 
tema de n ecuaciones simultáneas lineales, con base en la sección 9.6. 
Pruebe el programa resolviendo el problema 7.12. 

9.21 Recuerde, de la sección 8.2, que la química del agua expues- 
ta al CO, atmosférico se puede determinar despejando las cinco 
incógnitas de las cinco ecuaciones simultáneas no lineales [ecua- 
ciones (8.6) a (8.10)]: cy, [HCO5], [CO?7], [H*] y [OH]. Usando 
los parámetros de la sección 8.2 y el programa desarrollado en el 
problema 9.20, resuelva para las condiciones de 1958, cuando la 
presión parcial del CO, era de 315 ppm. Use sus resultados para 
calcular el pH. 


Descomposición LU 
e inversión de matrices 


En este capítulo se estudiará una clase de métodos de eliminación llamada técnicas de descomposi- 
ción LU, El principal recurso de la descomposición LU es que el paso de la eliminación que toma 
mucho tiempo se puede formular de tal manera que involucre sólo operaciones con la matriz de 
coeficientes [A]. Por esto, es muy adecuado para aquellas situaciones donde se deben evaluar muchos 
vectores (B) del lado derecho para un solo valor de [4]. Aunque hay muchas formas de hacer esto, 
el análisis se enfocará en mostrar cómo el método de eliminación de Gauss se implementa como una 
descomposición LU. 

Un motivo para introducir la descomposición LU es que proporciona un medio eficiente para 
calcular la matriz inversa. La inversa tiene muchas aplicaciones valiosas en la práctica de la inge- 
niería. Ésta ofrece también un medio para evaluar la condición de un sistema. 


10.1 DESCOMPOSICIÓN LU 


Como se describió en el capítulo anterior, la eliminación de Gauss sirve para resolver sistemas de 
ecuaciones algebraicas lineales, 


[ANA] = ([8B) (10.1) 


Aunque la eliminación de Gauss representa una forma satisfactoria para resolver tales sistemas, 
resulta ineficiente cuando deben resolverse ecuaciones con los mismos coeficientes [4], pero con 
diferentes constantes del lado derecho (las b). 

Recuerde que la eliminación de Gauss implica dos pasos: eliminación hacia adelante y sustitu- 
ción hacia atrás (figura 9.3). De ambas, el paso de eliminación hacia adelante es el que representa la 
mayor parte del trabajo computacional (recuerde la tabla 9.1). Esto es particularmente cierto para 
grandes sistemas de ecuaciones. 

Los métodos de descomposición LU separan el tiempo usado en las eliminaciones para la matriz 
[4] de las manipulaciones en el lado derecho (B). Una vez que [4] se ha “descompuesto”, los múlti- 
ples vectores del lado derecho [B) se pueden evaluar de manera eficiente. 

El hecho de que la misma eliminación de Gauss se puede expresar como una descomposición 
LU es muy interesante. Antes de mostrar cómo se puede realizar esto, demos primero una demos- 
tración matemática de la estrategia de descomposición. 


10.1.1 Revisión de la descomposición LU 


De manera similar al caso de la eliminación de Gauss, la descomposición LU requiere de pivoteo 
para evitar la división entre cero. Sin embargo, para simplificar la siguiente descripción, abordaremos 
el tema del pivoteo después de que el planteamiento fundamental se haya elaborado. Además, la 
siguiente explicación se limita a un conjunto de tres ecuaciones simultáneas. Los resultados se pue- 
den extender en forma directa a sistemas n dimensionales. 

La ecuación (10.1) se reordena como 


[4] (4) —- (BJ) =0 (10.2) 


Suponga que la ecuación (10.2) puede expresarse como un sistema triangular superior: 
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0 uy Ux kx,p=3d, (10.3) 


Observe que esto es similar a la manipulación que ocurre en el primer paso de la eliminación de 
Gauss. Es decir, se utiliza la eliminación para reducir el sistema a una forma triangular superior. La 
ecuación (10.3) también se expresa en notación matricial y se reordena como 


[UNX] -1Dj=0 (10.4) 

Ahora, suponga que existe una matriz diagonal inferior con números 1 en la diagonal, 
1.0.0 

[£J=|b, 1 0 (10.5) 
Lap Li 1 


que tiene la propiedad de que cuando se premultiplica por la ecuación (10.4), el resultado es la ecua- 
ción (10.2). Es decir, 


[LNLUNAS — (1D); = [4] — (B) (10.6) 
Si esta ecuación se satisface, según las reglas de multiplicación entre matrices, se obtendrá 

[L][U] = [4] (10.7) 
y 

[Dj =1(B) (10.8) 


Una estrategia de dos pasos (véase figura 10.1) para obtener soluciones se basa en las ecuaciones 
(10.4), (10.7) y (10.8): 


1. Paso de descomposición LU. [A] se factoriza o “descompone” en las matrices triangulares inferior 
[£] y superior [U]. 

2. Paso de la sustitución. [L] y [U] se usan para determinar una solución [X] para un lado derecho 
(5). Este paso, a su vez, se divide en dos. Primero, la ecuación (10.8) se usa para generar un 
vector intermedio (D] mediante sustitución hacia adelante. Después, el resultado se sustituye 
en la ecuación (10.4), la que se resuelve por sustitución hacia atrás para (X]). 


Ahora se mostrará cómo se puede llevar a cabo la eliminación de Gauss en esta forma. 


10.1.2 Versión de la eliminación de Gauss usando la descomposición LU 


Aunque a primera vista podría parecer que la eliminación de Gauss no está relacionada con la eli- 
minación LU, aquélla puede usarse para descomponer [4] en [£] y [U], lo cual se observa fácilmen- 
te para [U], que es el resultado directo de la eliminación hacia adelante. Recuerde que en el paso 
correspondiente a esta eliminación se pretende reducir la matriz de coeficientes [4] a la forma 


4 Aj 4 
[U]=|0 a) 4 (10.9) 
0 0 a 
que es el formato triangular superior deseado. 


Aunque quizá no sea muy clara, la matriz [£] se produce durante este paso. Lo anterior se ilus- 
tra fácilmente con un sistema de tres ecuaciones, 
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a) Decomposición MA 


ES y =p b)Hacia 


(o) adelante 


| 2 r Sustitución 


y Cc) Hacia 


trás 
Lx) : 


Figura 10.1 
Pasos en la descomposición LU. 


El primer paso en la eliminación de Gauss consiste en multiplicar el renglón 1 por el factor [recuer- 
de la ecuación (9.13)] 


y restar el resultado al segundo renglón para eliminar a,. De forma similar, el renglón 1 se multi- 
plica por 


y el resultado se resta al tercer renglón para eliminar az,. El paso final es multiplicar el segundo 
renglón modificado por 


f ES ds) 
S a 
y restar el resultado al tercer renglón para eliminar as. 

Ahora suponga que realizamos todas esas operaciones sólo en la matriz [A]. Resulta claro que 
si no se quiere modificar la ecuación, se tiene que hacer lo mismo con el lado derecho (B). Pero no 
existe ninguna razón para realizar las operaciones en forma simultánea. Se podrían conservar las f 
y después manipular (B). 

¿Dónde se guardan los factores f1, f3, y f32? Recuerde que la idea principal de la eliminación 
fue crear ceros en a»;, 43, y 3. Entonces, se puede guardar f», en a», f3, en az, y f3, en az,. Después 
de la eliminación la matriz [4], por lo tanto, se describe como 


E 
, 
Li dr 0 (10.10) 
"Y 
fi f2 4 


De hecho, esta matriz representa un almacenamiento eficiente de la descomposición LU de [A], 


[4] > [£]110] (10.11) 
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donde 


0 0 a 
y 
1.0.0 
[Ll=1f, 1 0 
fa fa 1 


El siguiente ejemplo confirma que [4] = [£][U]. 


EJEMPLO 10.1 Descomposición LU con eliminación de Gauss 


Planteamiento del problema Obtenga una descomposición LU basándose en la eliminación 
de Gauss que se realizó en el ejemplo 9.5. 


Solución En el ejemplo 9.5, se resolvió la matriz 


2-0 202 
[4]=10.1. 7 03 
0.3 0.2 10 


Después de la eliminación hacia adelante, se obtuvo la siguiente matriz triangular superior: 


3  —01 0.2 
[U]=|0 7.00333 -—0.293333 
0 0 10.0120 


Los factores empleados para obtener la matriz triangular superior se pueden colocar en una matriz 
triangular inferior. Los elementos a,, y az, se eliminaron al usar los factores 


1 y 
fi= 22 0.03333333 qa =2=0.1000000 


y el elemento a, se elimina al usar el factor 


0.19 


== =-0.0271300 
7.00333 


Así, la matriz triangular inferior es 


1 0 0 
[£] =| 0.0333333 1 0 
0.100000  —0.0271300 1 


En consecuencia, la descomposición LU es 


1 0 0113  —0.1 0.2 
[4]=[£][0]=|0.0333333 1 0||0 7.00333 -—0.293333 
0.100000  —0.0271300 1||0 0 10.0120 


10.1 Descomposición LU 


Este resultado se verifica al realizar la multiplicación de [£][U] que da 


3 0.1. 0.2 
[£][U]=[0.0999999 7 0.3 
0.3 0.2 9.99996 


donde las pequeñas diferencias se deben a errores de redondeo. 


El siguiente es el pseudocódigo de una subrutina para realizar la fase de descomposición: 


SUB Decompose (a, n) 
DOFOR k= 1, n- 1 
DOFOR ¡=k+ 1, n 
factor = as x/arx 
dix = factor 
DOFOR j=k+l,n 
di = di ¡y > factor * as 
END DO 
END DO 
END DO 
END Decompose 


Observe que este algoritmo es “simple” en el sentido de que no se incluye el pivoteo. Esta caracterís- 
tica se agregará más tarde cuando se desarrolle el algoritmo completo para la descomposición LU. 

Después de descomponer la matriz, se puede generar una solución para un vector particular (B). 
Esto se lleva a cabo en dos pasos. Primero, se realiza un paso de sustitución hacia adelante al resolver 
la ecuación (10.8) para (Dj. Es importante notar que esto sólo se refiere a la realización de las ope- 
raciones de la eliminación en (Bj. De esta forma, al final del procedimiento, el lado derecho estará 
en el mismo estado que si se hubiesen realizado las operaciones hacia adelante sobre [4] y (B) en 
forma simultánea. 

El paso de la sustitución hacia adelante se representa en forma concisa como 


d/=b, Y ad, parai=2,3,....n (10.12) 
j=1 
En el segundo paso, entonces, tan sólo se realiza la sustitución hacia atrás, como en la ecuación 
(10.4). Otra vez, es importante reconocer que este paso es idéntico al de la fase de sustitución hacia 
atrás, en la eliminación de Gauss convencional. Así, de manera similar a las ecuaciones (9.16) y 
(9.17), el paso de la sustitución hacia atrás se representa en forma concisa como 


Xp = A/A (10.13) 
d,- y aX; 
q MA parai=n=1,n-2,...,1 (10.14) 
a 


EJEMPLO 10.2 Pasos en la sustitución 


Planteamiento del problema  Termine el problema que se inició en el ejemplo 10.1 para gene- 
rar la solución final con eliminación hacia adelante y sustitución hacia atrás. 


Solución Como se estableció antes, la intención de la sustitución hacia adelante es aplicar las 
operaciones de eliminación al vector (B], previamente aplicadas a [4]. Recuerde que el sistema 
resuelto en el ejemplo 9.5 fue 
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3 0.1 -02](x,] (7.85 
0.1. 7 -03|4x,p=4-193 
0.3 -02 10 [lx] |714 


y que la fase de eliminación hacia adelante del método de eliminación convencional de Gauss dio 
como resultado 


3  —01 0.2 2% 7.85 
O 7.00333 —0.293333 [+ x,p=3-—19.5617 (E10.2.1) 
0 0 10.0120 ||x, 70.0843 


La fase de la sustitución hacia adelante se realiza aplicando la ecuación (10.7) a nuestro pro- 
blema, 


1 0 01(4,1 (7.385 
0.0333333 1 01/d,+=4-19.3 
0.100000 -0.0271300 1|ld,| |71.4 


o, despejando por multiplicación del lado izquierdo, 


dy =7.85 
0.0333333d, + d  =-193 
0.1d, - 0.02713d, + d,=71.4 


Se resuelve la primera ecuación para d,, 
d¡ =7.85 
la cual se sustituye en la segunda ecuación y se resuelve para 
d, =-19.3 — 0.0333333(7.85) = -19.5617 
Ambas, d y d,, se sustituyen en la tercera ecuación para 
d3¿=71.4 - 0.1(7.85) + 0.02713(-19.5617) = 70.0843 
Así, 
7.85 


(Dj =4-19.5617 
70.0843 


que es idéntica al lado derecho de la ecuación (E10.2.1). 
Este resultado se sustituye, entonces, en la ecuación (10.4), [UJ(X] = (D], para obtener 


3  —0.1 0.2 Na 7.85 
O 7.00333 -—0.293333 |< x,+=3-19.5617 
0 0 10.0120 |[x, 70.0843 


que se resuelve por sustitución hacia atrás (véase el ejemplo 9.5 para más detalles) para obtener la 
solución final, 


3 
00=) 25 
7.00003 


10.1 Descomposición LU 


El siguiente es el pseudocódigo de una subrutina para implementar ambas fases de sustitución: 


SUB Substitute (a, n, b, Xx) 
sustitución hacia adelante 
DOFOR 1 = 2, n 

sum = b; 
DOFOR j= 1, 1 - 1 
sum = sum -= aj * b; 
END DO 
b; = sum 
END DO 
sustitución hacia atrás 
Xn = Dr /an.n 
DOFOR 1 =m-1, 1, -1 


sum = 0 
DOFOR j= 1+1,n 
Sum = SUM + dj 7 * Xj 
END DO 
Xx; = (b, - sum)/a; ; 
END DO 


END Substitute 


El algoritmo de descomposición LU requiere los mismos flops de multiplicación/división tota- 
les que la eliminación de Gauss. La única diferencia es que se aplica un menor trabajo en la fase de 
descomposición, debido a que las operaciones no se aplican al lado derecho. De esta forma, el nú- 
mero de flops de multiplicación/división en la fase de descomposición se calculan así: 


3 3 


n n n 
n n conforme n * ,0m (10.15) 
3 aumenta 3 


Por lo contrario, la fase de sustitución requiere de un mayor trabajo. Así, el número de flops para 
la sustitución hacia adelante y hacia atrás es n?, El trabajo total es, por lo tanto, idéntico al de la 
eliminación de Gauss 


El E) 
n n 2 conforme n n 2 
— == —+ 1% > — +0 
3.3 ds aumenta 3 07 06) 


10.1.3 Algoritmo para la descomposición LU 


En la figura 10.2 se presenta un algoritmo que implementa la descomposición LU con eliminación 
de Gauss. Vale la pena mencionar cuatro características de este algoritmo: 


+ Los factores generados durante la fase de eliminación se guardan en la parte inferior de la ma- 
triz. Esto puede hacerse debido a que de cualquier manera éstos se convierten en ceros y no son 
necesarios en la solución final. Este almacenamiento ahorra espacio. 

+ El algoritmo lleva cuenta del pivoteo al usar un vector de orden O. Esto acelera notablemente 
el algoritmo, ya que sólo se pivotea el vector (y no todo el renglón). 

+ Las ecuaciones no están escaladas, pero se usan valores escalados de los elementos para deter- 
minar si se va a usar el pivoteo. 

+ El término de la diagonal se verifica durante la fase de pivoteo para detectar ocurrencias cercanas 
a cero con el propósito de advertir al usuario respecto de sistemas singulares. Si baja de un valor 
er =-—1, entonces se ha detectado una matriz singular y se debe terminar el cálculo. El usuario 
le da a un parámetro tol un valor pequeño, para detectar ocurrencias cercanas a cero. 
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b) 
c) 
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Figura 10.3 


Un esquema que 
muestra las evaluacio- 
nes implicadas en la 
descomposición LU de 
Crout. 
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SUB Ludecomp (a, b, n, tol, x, er) END IF 
DIM 0,, Sp END Decompose 
er= 0 
CALL Decompose(a, n, tol, o, s, er) SUB Pivot(a, 0, Ss, M, K) 
IF er <> -1 THEN p = K 
CALL Substitute(a, 0, N, b, x) big = ABSCao(xr,k PSotro) 
END IF DOFOR ¡i¡=k+1l,n 
END Ludecomp dummy = ABS(8011),k /Socii)? 
IF dummy > big THEN 
SUB Decompose (a, n, tol, O, s, er) big = dummy 
DOFOR 71 = 1, n p= ii 
oy = 1 END IF 
Si; = ABS(a; 1) END DO 
DOFOR j = 2, n dummy = 0, 
IF ABS(a; ¿)>s; THEN s; = ABS(a; ;) 0. =0 
19) k 
END DO 0; = dummy 
EN. 20 END Pivot 
DOFOR k= 1, n- 1 
CALL Pivot(a, 0, S, n, k) SUB Substitute (a, 0, Nn, D, Xx) 
IF ABS(aoo).x /Socx)) < tol THEN DOFOR i¡= 2, n 
er = =Í sum = Do) 
PRINT dol Soto DOFOR j= 1, 7-1 
EXIT DO sum = sum = dos) * Doy) 
END IF END DO 
DOFOR 1 =k+l1,n Do(¡, = SUM 
factor = do), /0o(k).k END DO 
do), xk = factor Xn = Don) l8o(m),n 
DOFOR j=k+w+l1,n DOFOR i¡= n= 1, 1, -1 
docir.j = doc), 5 7 Factor * dom), sum = 0 
END DO DOFOR j= 1+ 1, n 
END DO sum + SUM + do) * Xj 
END DO END DO 
IF ABS(d00.x/Socx)) < tol THEN Xi = (Dori) > SUM) 205) 5 
er= -1 END DO 
PRINT 2010. Sor) END Substitute 
Figura 10.2 


Pseudocódigo para un algoritmo de descomposición LU. 


10.1.4 Descomposición Crout 


Observe que en la descomposición LU con la eliminación de Gauss, la matriz [£] tiene números 1 
en la diagonal. Formalmente, a esto se le denomina descomposición o factorización de Doolittle. 
Un método alternativo usa una matriz [U] con números 1 sobre la diagonal. Esto se conoce como 
descomposición Crout. Aunque hay algunas diferencias entre estos métodos, su funcionamiento es 
comparable (Atkinson, 1978; Ralston y Rabinowitz, 1978). 

El método de descomposición de Crout genera [U] y [£] barriendo las columnas y los renglones 
de la matriz, como se ilustra en la figura 10.3. La descomposición de Crout se puede implementar 
mediante la siguiente serie concisa de fórmulas: 


Li, = 4; parai=1,2,...,n (10.17) 


a,. 
ly paraj=2,3,...,n (10.18) 
11 


10.2 La matriz inversa 


DOFOR j = 2, n 


jl 
1,=4y DY, 100, parai=jj+1l,....n (10.19) — a,,= ay/aj, 
ren END DO 
DOFOR j= 2, n-l 
ja DOFOR i= j, n 
ayy, l ¡Ue sum= 0 
= El parak=j+1,j+2,....n (10.20) DOFOR k = 1, Jj - 1 
l. SUM = SUM A+ dk * dj 
y END DO 
n-1 di = dj = sum 
Ds e Ann a y Di Mo (10.21) END DO : 
k=1 DOFOR k = + 1, n 
Además de que consiste de pocos ciclos, el método anterior sum = 0 . 
también tiene la ventaja de economizar espacio de almacenamien- DOLORS ed da 
to. No hay necesidad de guardar los números 1 que están en la oa E 


diagonal de [U] o los números cero de [£] o [U], ya que se dan en 
el método. En consecuencia, los valores de [U] se pueden guardar END DO 

en el espacio de los ceros de [L]. Además, mediante un cuidadoso  fyp p 0 

examen de lo anterior, queda claro que después de que un elemen- sm = 0 

to de [4] se emplea una vez, nunca vuelve a utilizarse. Por lo. DOFOR k= 1, n - 1 


tanto, conforme se va calculando cada elemento de [£] y [U], se SUM = SUM + dnx* den 
puede sustituir por el elemento correspondiente de [4] (como se  £ND DO 
designó por sus subíndices). dan = dan > SUM 


El pseudocódigo para realizar esto se presenta en la figura 
10.4. Observe que la ecuación (10.17) no está incluida en el pseu- Figura 10.4 
docódigo, porque la primera columna de [£] ya se guardó en [A]. 
De otra forma, el algoritmo sigue, en forma directa, de las ecua- 
ciones (10.18) a la (10.2). 


de Crout. 


10.2 LA MATRIZ INVERSA 


En el estudio de las operaciones con matrices (sección PT3.2.2), vimos que si una matriz [A] es 
cuadrada, existe otra matriz [A]*, conocida como la inversa de [A], para la cual [ecuación (PT3.3)] 


[A][4]" = [4J"[4] = [1] 


Ahora se enfocará el análisis hacia el modo en que la matriz inversa se calcula numéricamente. 
Después se explorará cómo se utiliza para el diseño en ingeniería. 


10.2.1 Cálculo de la inversa 


La inversa se puede calcular en forma de columna por columna, generando soluciones con vectores 
unitarios como las constantes del lado derecho. Por ejemplo, si la constante del lado derecho de la 
ecuación tienen un número 1 en la primera posición, y ceros en las otras, 
1 
(bj =30 
0 


la solución resultante será la primera columna de la matriz inversa. En forma similar, si se emplea 
un vector unitario que tiene un número 1 en el segundo renglón 


0 
()=+)1 
0 


el resultado será la segunda columna de la matriz inversa. 


dix = (aj, > sum)/a;, ; 
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La mejor forma de realizar un cálculo como éste es con el algoritmo de descomposición LU, 
descrito al inicio de este capítulo. Recuerde que una de las ventajas más importantes de la descom- 
posición LU es que proporciona un medio eficiente para evaluar diversos vectores del lado derecho. 
Por lo tanto, resulta ideal para evaluar los vectores unitarios requeridos en el cálculo de la inversa. 


EJEMPLO 10.3 Inversión de matrices 


Planteamiento del problema Emplee la descomposición LU para determinar la matriz inver- 
sa del sistema del ejemplo 10.2. 


Bn 01) 0% 
[4]=10.1. 7 03 
0.3 02 10 


Recuerde que la descomposición dio como resultado las siguientes matrices triangulares inferior y 
superior: 


3  —01 0.2 1 0 0 
[U]=|0 7.00333 -—0.293333| [£]=|0.0333333 1 0 
0 0 10.0120 0.100000  —0.0271300 1 


Solución La primera columna de la matriz inversa puede determinarse al efectuar el procedimien- 
to de solución por sustitución hacia adelante, con un vector unitario (con el número 1 en el primer 
renglón) como el vector del lado derecho. Así, de la ecuación (10.8), el sistema diagonal inferior es 


1 0 (al (1 
0.0333333 1 0|4d,p+=40 
0.100000 -0.0271300 1|la,| |0 


de donde, por sustitución hacia adelante, se obtiene ([D"= [1 —0.03333 —0.1009]. Este vector se 
utiliza como el lado derecho de la ecuación (10.3), 


3-01 02 Tx 1 
0 7.00333 -0.293333 |4 x, + =3-0.03333 
0 0 10.0120 |[x,] | -0.1009 


de donde, por sustitución hacia atrás, se obtiene (X)” = [0.33249 -—0.00518 -—0.01008], que es la 
primera columna de la matriz, 


0.33249 0 0 
[AJ” =|-0.00518 0 0 
-0.01008 0 0 


Para determinar la segunda columna, la ecuación (10.8) se formula como 


1 0 01(a,) fo 
0.0333333 1 0|/d,+=41 
0.100000 -0.0271300 1|la,| lo 


De donde se puede obtener (D], y los resultados se usan con la ecuación (10.3) para determinar (Xy” 
= [0.004944  0.142903  0.00271], que es la segunda columna de la matriz, 
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0.33249  0.004944 0 
[A]” =|-0.00518 0.142903 0 
-0.01008  0.00271 0 


Por último, los procedimientos de sustitución hacia adelante y de sustitución hacia atrás pueden 
usarse con (B)"= lo o 1, para obtener ([X)"=[0.006798 0.004183 0.09988], que es la columna 
final de la matriz, 


0.33249  0.004944  0.006798 
[A]" =|-0.00518 0.142903 0.004183 
-0.01008  0.00271  0.09988 


La validez de este resultado se comprueba al verificar que [4][4]7 = [7]. 


El pseudocódigo para generar la matriz inversa se muestra en la figura 10.5. Observe cómo se 
llama a la subrutina de descomposición de la figura 10.2, para realizar la descomposición, y después 
se genera la inversa llamando repetidamente el algoritmo de sustitución con vectores unitarios. 

El trabajo requerido para este algoritmo se calcula fácilmente como 
E 4n  n 


2 
373 id mn”) 3573 (10.22) 


descomposición + n X sustituciones 


donde, de acuerdo con la sección 10.1.2, la descomposición está definida por la ecuación (10.15) y 
el trabajo necesario en cada evaluación del lado derecho requiere n? flops de multiplicación/ división. 


10.2.2 Cálculos estímulo-respuesta 


Como se vio en la sección PT3.1.2, muchos de los sistemas de ecuaciones lineales usados en la 

práctica de la ingeniería se obtienen de las leyes de la conservación. La expresión matemática de 

dichas leyes es algún tipo de ecuación de balance que asegura que una 

propiedad específica se conserve (masa, fuerza, calor, momentum u otra). UL icmboss de a. dede 
En un balance de fuerzas de una estructura, las propiedades pueden Ser + ¿7 - 0 THEN 
los componentes horizontal o vertical de las fuerzas que actúan sobre DOFOR ¡= 1, 


cada nodo de la estructura (véase la sección 12.2). En un balance de masa, DOFOR j= 1 ? n 
las propiedades pueden ser la masa en cada reactor de un proceso quími- IF. ¡= j THEN 
co (véase la sección 12.1). Se tendrán ejemplos similares en otros campos b(J)= 1 
de la ingeniería. ELSE 

Al tenerse una ecuación de balance para cada parte del sistema, da b(J)=0 
como resultado un conjunto de ecuaciones que definen el comportamien- END IF 


END DO 


to de las propiedades en todo el sistema. Estas ecuaciones se interrela- ] 
Call Substitute (a, 0, n, b, Xx) 


cionan, ya que cada ecuación puede tener una o más de las variables de DOFOR j= 1, n 
las otras ecuaciones. En muchos casos, estos sistemas son lineales y, por tE 0) Z 0, 
lo tanto, de la forma que se trata en este capítulo: END DO 

[AJ(X) = (B) a A 

salida a, sí lo desea 

Ahora bien, para las ecuaciones de balance, los términos de laecua- ELSE 
ción (10.23) tienen una interpretación física definida. Por ejemplo, los PRINT “sistema mal condicionado” 
elementos de (X] son los valores de la propiedad que se balanceará en END IF 
cada parte del sistema. En el balance de fuerzas de una estructura, repre- Figura 10.5 
sentan las fuerzas vertical y horizontal en cada miembro. En el balance Programa principal que usa algunos de los subpro- 
de masa, los elementos de (X) son las masas de sustancias químicas en  gramas de la figura 10.2 para generar una matriz 
cada reactor. En cualquier caso, representan la respuesta o estado del inversa. 
sistema, que se está tratando de determinar. 
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El vector del lado derecho [B| contiene los elementos del balance que son independientes del 
comportamiento del sistema (es decir, son constantes). Como tales, representan las fuerzas externas 
o los estímulos que rigen al sistema. 

Finalmente, la matriz de coeficientes [4] contiene los parámetros que expresan cómo interactúan 
las partes del sistema. En consecuencia, la ecuación (10.23) se puede expresar como: 


[interacciones] [respuesta] = [estímulos] 


Así, la ecuación (10.23) puede verse como una expresión del modelo matemático fundamental que 
se formuló anteriormente como una sola ecuación en el capítulo 1 [recuerde la ecuación (1.1)]. Aho- 
ra se percibe que la ecuación (10.23) representa una versión para sistemas interrelacionados con 
diversas variables dependientes [X]. 

Como ya hemos visto en este capítulo y en el anterior, existen varias formas de resolver la ecua- 
ción (10.23). Sin embargo, usando la matriz inversa se obtiene un resultado particularmente intere- 
sante. La solución formal se expresa como 


(X) =[4(B) 


o (recordando la definición de la multiplicación matricial del cuadro PT3.2) 


ji 1 1 
x, = 431b, + 47,b, + a33b; 
41 | 1 
x= 43) b, + 42b)+ 30; 
Sa j e] 
x3 = 431 b, + 432 b, + a33b; 


De esta forma, se ha encontrado que la misma matriz inversa, además de ofrecer una solución, tiene 
propiedades extremadamente útiles. Es decir, cada uno de sus elementos representa la respuesta de 
una sola parte del sistema a un estímulo unitario de cualquier otra parte de dicho sistema. 

Observe que estas formulaciones son lineales y, por lo tanto, se satisfacen la superposición y 
la proporcionalidad. La superposición significa que si un sistema está sujeto a varios estímulos (las 
b), las respuestas se pueden calcular individualmente y los resultados se suman para obtener la 
respuesta total. La proporcionalidad significa que al multiplicar los estímulos por una cantidad el 
resultado es la respuesta a esos estímulos multiplicada por la misma cantidad. Así, el coeficiente 
a¡| es una constante de proporcionalidad que da el valor de x, correspondiente a una cantidad uni- 
taria b,. Este resultado es independiente de los efectos de b, y bz sobre x,, los cuales se reflejan en 
los coeficientes a7) y az!, respectivamente. Por lo tanto, se llega a la conclusión general de que el 
elemento a;|' de la matriz inversa representa el valor de x, debido a la cantidad unitaria b;. Usando 
el ejemplo de la estructura, el elemento a;;' de la matriz inversa representaría la fuerza en el miem- 
bro i debida a una fuerza unitaria externa en el nodo j. Incluso para sistemas pequeños, dicho 
comportamiento de interacciones estímulo-respuesta individuales podría no ser intuitivamente 
obvio. Como tal, la matriz inversa ofrece una poderosa técnica para comprender las interrelaciones 
entre las partes componentes de sistemas complicados. Este poder se demostrará en las secciones 
12.1 y 12.2. 


10.3 ANÁLISIS DEL ERROR Y CONDICIÓN DEL SISTEMA 


Además de sus aplicaciones a la ingeniería, la inversa también proporciona un medio para determi- 
nar si los sistemas están mal condicionados. Están disponibles tres métodos para este propósito: 


1. Escalar la matriz de coeficientes [4], de manera que el elemento más grande en cada renglón sea 1. 
Se invierte la matriz escalada, y si existen elementos de [4]"! que sean varios órdenes de magnitud 
mayores que uno, es posible que el sistema esté mal condicionado (véase el cuadro 10.1). 

2. Multiplicar la inversa por la matriz de coeficientes original y estimar si el resultado es lo su- 
ficientemente cercano a la matriz identidad. Si no es así, esto indica que el sistema está mal 
condicionado. 

3. Invertir la matriz inversa y estimar si el resultado está lo suficientemente cercano a la matriz de 
coeficientes original. Si no es así, esto de nueva cuenta indica que el sistema está mal condicionado. 


10.3 Análisis del error y condición del sistema 


Cuadro 10.1 
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Interpretación de los elementos de la matriz inversa 


como una medida de mal condicionamiento 


Un método para determinar la condición de un sistema consiste en 
escalar [4] de tal forma que el elemento mayor en cada renglón sea 
1 y después calcular [4]. Si los elementos de [A]? son varios órde- 
nes de magnitud mayores que los elementos de la matriz escalada 
original, es probable que el sistema esté mal condicionado. 

Se puede obtener cierto conocimiento con este método al recordar 
que una forma de verificar si una solución aproximada (X) es acep- 
table, es sustituyéndola en las ecuaciones originales y observar si 
resultan las constantes originales del lado derecho. Esto equivale a 


(RJ = (BJ -[ANX) (C10.1.1) 


donde (R) es el residuo entre las constantes del lado derecho y los 
valores calculados con la solución (X). Si (R) es pequeño, se con- 
cluye que los valores de (X) son adecuados. Suponiendo que (X) es 
la solución exacta que da un residuo cero, entonces 


(0) = (B) - [4109 (C10.1.2) 


Restando la ecuación (C10.1.2) de (C10.1.1) resulta 
(Ry =1a1(00 - 2) 

Multiplicando ambos lados de esta ecuación por [4]"! se obtiene 
20) - 19 =[AJ(R) 


Este resultado indica por qué la verificación de una solución por 
sustitución puede ser engañosa. Para casos donde los elementos de 
[AT! son grandes, una pequeña discrepancia en el residuo (R] del 
lado derecho, puede corresponder a un gran error (X) — (X) en el 
valor calculado de las incógnitas. En otras palabras, un residuo pe- 
queño no garantiza una solución exacta. Aunque, puede concluirse 
que si el elemento mayor de [A]"' es de un orden de magnitud unita- 
ria, se puede considerar que el sistema está bien condicionado. De 
modo contrario, si [A] contiene elementos mucho más grandes que 
la unidad se concluye que el sistema está mal condicionado. 


Aunque estos métodos llegan a indicar un mal condicionamiento, sería preferible obtener un 
solo número (al igual que el número de condición de la sección 4.2.3) que sirviera como un indicador 
del problema. Los intentos que se han hecho para formular tal número de condición matricial están 


basados en el concepto matemático de la norma. 


10.3.1 Normas vectoriales y matriciales 


Una norma es una función que toma valores reales y que proporciona una medida del tamaño o 
“longitud” de entidades matemáticas multicomponentes, como los vectores y las matrices (véase 


cuadro 10.2). 


Un ejemplo simple es un vector en el espacio euclidiano tridimensional (figura 10.6) que se 


representa como 


lf]=La b e] 


donde a, b y c son las distancias a lo largo de los ejes x, y y z, respectivamente. La longitud de este 
vector [esto es, la distancia de la coordenada (0, O, 0) a (a, b, c)] se calcula simplemente como 


IF = va +b?+c? 


donde la nomenclatura || ll indica que a esta longitud se refiere a la norma 


euclidiana de [FF]. 


En forma similar, para un vector n dimensional Lx] = Lx, Xoo 


norma euclidiana se calcularía como 


[XI], = 


El concepto puede extenderse además a una matriz [A], de la siguiente ma- 


nera 


a la cual se le da un nombre especial (la norma de Frobenius). De la misma 
manera como las normas de vectores, proporciona un valor único para cuanti- 


ficar el “tamaño” de [A]. 


Xn, una 


(10.24) 


Figura 10.6 
Representación gráfica de un vector | F | = 
[a b c] en el espacio euclidiano. 
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Debe notarse que hay alternativas para las normas euclidiana y de Frobenius (véase cuadro 10.2). 
Por ejemplo, la norma vector uniforme se define como 


[XI] = máx lx 


1<i<n 


Es decir, el elemento con el mayor valor absoluto se toma como la medida del tamaño del vector. En 
forma similar, una norma matricial uniforme o norma renglón-suma se define como 


n 


[Al =máx Y 
1<i<n 


ja 


a 


(10.25) 


En este caso, se calcula la suma del valor absoluto de los elementos por cada renglón, y la mayor de 


éstas se toma como la norma. 


Aunque hay ventajas teóricas para el uso de ciertas normas, la elección está influenciada por 
consideraciones prácticas. Por ejemplo, la norma renglón-uniforme es ampliamente usada por la 
facilidad con que se calcula, y porque usualmente proporciona una medida adecuada del tamaño de 


la matriz. 


10.3.2 Número de condición de una matriz 


Ahora que se ha presentado el concepto de norma, se puede usar para definir 


Cond [4] =llal|- lla-"] 


(10.26) 


donde Cond [A] se llama número de condición de una matriz. Observe que para una matriz [A], este 
número será mayor o igual a 1. Se puede mostrar (Ralston y Rabinowitz, 1978; Gerald y Wheatley, 


2004) que 


Cuadro 10.2 Normas matriciales 


Como se vio en esta sección, las normas euclidianas se emplean para 
cuantificar el tamaño de un vector, 


Para vectores, existen alternativas llamadas normas p que se re- 
presentan generalmente por 


a 

, 

Y» 
i=l 


Vp 


2, SON 


idénticas para vectores. 
Otros ejemplos importantes son 


Ñ 
lx => d+] 
i=l 


que representa la norma como la suma de los valores absolutos de 
los elementos. Otra es la norma magnitud-máxima o norma vector- 
uniforme. 


IX] = máx | 


1<i<n 


la cual define la norma como el elemento con el mayor valor abso- 
luto. 


Utilizando un método similar, se pueden desarrollar normas para 
matrices. Por ejemplo, 


(41,269), la 
1<j<n = 4 


Esto es, se realiza una sumatoria de los valores absolutos de los co- 
eficientes para cada columna, y la mayor de estas sumatorias se toma 
como la norma. Esto se conoce como la norma columna-suma. 


Una determinación similar se puede hacer para los renglones, y 
resulta una matriz-uniforme Oo norma renglón-suma, 


NAIL =m6 Y, la, 
1<i<n 


Debe observarse que, en contraste con los vectores, la norma 2 
y la norma euclidiana para una matriz no son lo mismo. Mientras 
que la norma euclidiana llall. puede ser fácilmente determinada 
mediante la ecuación (10.24), la norma 2 para matrices all se 
calcula así: 


lla ll, = (Una) 


donde ,,4, es el mayor valor característico de [4]"[4]. En el capítu- 
lo 27 se verá más sobre valores característicos. Mientras tanto, el 
punto importante es que la norma lla! 2, 0 norma espectral, es la 
norma mínima y, por lo tanto, proporciona la medida de tamaño más 
ajustada (Ortega, 1972). 


10.3 Análisis del error y condición del sistema 


1 ona y4¡ LA 
[ix] [al] 
Es decir, el error relativo de la norma de la solución calculada puede ser tan grande como el error 
relativo de la norma de los coeficientes de [4], multiplicada por el número de condición. Por ejemplo, 
si los coeficientes de [4] se encuentran a £ dígitos de precisión (esto es, los errores de redondeo son 
del orden de 107") y Cond [4] = 10", la solución [X] puede ser válida sólo para t — c dígitos (errores 
de redondeo - 105, 


EJEMPLO 10.4 Evaluación de la condición de una matriz 


Planteamiento del problema La matriz de Hilbert, que es notoriamente mal condicionada, se 
representa como 


e 18 13 << Un 
nm 13 VY4  - Un+1) 


[Un Vn+D 1m+2) -- 1/Qn-1)| 


Use la norma renglón-suma para estimar el número de condición de la matriz de Hilbert de 3 x 3, 


1 12 13 
[4]=/12 13 1/4 
V3 1/4 1/5 


Solución Primero, la matriz se normaliza de tal forma que el elemento máximo en cada renglón 
sea l. 


1.12 13 
[4]=11 23 12 
1 3/4 3/5 


Sumando cada uno de los renglones el resultado es 1.833, 2.1667 y 2.35. Entonces, el tercer renglón 
tiene la suma mayor y la norma renglón-suma es 


AL =14 7 +Í=235 


La inversa de la matriz escalada se calcula como 


9 -18 10 
[AJ' =|-36 96 -60 
30 -90 60 


Observe que los elementos de esta matriz son mayores que los de la matriz original. Esto también 
se refleja en su norma renglón-suma, la cual se calcula como 


La". = 1-36] + [96] + |-60| = 192 
Entonces, el número de condición se calcula como 
Cond [A] = 2.35(192) = 451.2 


El hecho de que el número de condición sea considerablemente mayor que la unidad sugiere que 
el sistema está mal condicionado. La importancia del mal condicionamiento puede ser cuantificado 
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al calcular c =1l0g 451.2 =2.65. Las computadoras que usan una representación de punto flotante IEEE 
tienen aproximadamente 1 = log 27?*= 7,2 dígitos significativos en base 10 (recuerde la sección 3.4.1). 


Por lo tanto, la solución puede tener errores de redondeo de hasta 109-6572) = 3 x 107. Observe que 
una estimación como ésta casi siempre sobrepredice el error verdadero. Sin embargo, son útiles para 
alertar al usuario en el caso de que los errores de redondeo puedan resultar significativos. 


En pocas palabras, el problema al usar la ecuación (10.26) es el precio computacional requerido 
para obtener | [4 I. Rice (1983) indica algunas posibles estrategias para reducir el problema. Además, 
él sugiere una forma alternativa para determinar la condición del sistema: ejecute la misma solución 
en dos diferentes compiladores. Ya que los códigos resultantes implementan en forma diferente la 
aritmética, el efecto de mal condicionamiento debería ser evidente en un experimento como ése. Por 
último, se debe mencionar que los paquetes de software, como MATLAB y Mathcad, tienen la ca- 
pacidad para calcular en forma conveniente la condición de una matriz. Revisaremos estas capaci- 
dades cuando se vean esos paquetes al final del capítulo 11. 


10.3.3 Refinamiento iterativo 


En algunos casos, los errores de redondeo se reducen con el siguiente procedimiento. Suponga que 
se está resolviendo el siguiente sistema de ecuaciones: 


41%] + Mpx) + 4133 =b, 
02141 + A929X) + (733 = b, (10.27) 
31X] + (437X) + 433%3 = Dz 
Se limitará el siguiente análisis a un sistema pequeño de (3 x 3). Aunque este método se puede ge- 
neralizar para aplicarlo a sistemas de ecuaciones lineales más grandes. 


Suponga que una solución aproximada en forma vectorial es 0: y"= Lx ¡xa Xx sl Esta solución 
se sustituye en la ecuación (10.27) para tener 


41%, + ap, + 413% =0b 
1x1 + A79Xa «+ 73X3 = b, (10.28) 
43%] + 437X, + 033% =D) 


Ahora, suponga que la solución exacta (X) está expresada como una función de la solución aproxi- 
mada y de un vector de factores de corrección (AX), donde 


X1 =X1 + Ax; 
1, =%, +A, (10.29) 
X3 =X3 + Ax; 


Estos resultados se sustituyen en la ecuación (10.27), para obtener el siguiente sistema: 
411%, + Ax) + ay (%, + Ax>) + 13% + Ax) =b 
a21(%; + Ax) + a2,(%) + Ax)) + 093% + Axz) =D, (10.30) 
43/(%, + Ax) + a3(%) + Ax) + d33(%3 + Axz) = b) 
Ahora, la ecuación (10.28) se resta de la (10.30) para dar 
ay¡Ax, + agAx, + a413Ax, =b, — b, =E, 
a,¡Ax, + d77Ax, + d73Ax3 = b, — b, = E) (10.31) 
az¡Ax, + a37Ax, + 433Ax3 =b3 by =E, 


Así este sistema es un conjunto de ecuaciones lineales simultáneas que puede resolverse para obtener 
los factores de corrección. Dichos factores se aplican para mejorar la solución, como lo especifica 
la ecuación (10.29). 
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Es relativamente sencillo agregar un procedimiento de refinamiento iterativo en los programas 
de computadora para métodos de eliminación. Esto es especialmente efectivo para los métodos de des- 
composición LU descritos antes, los cuales sirven para evaluar en forma eficiente varios vectores del 
lado derecho. Observe que para ser efectivos en sistemas mal condicionados, las E en la ecuación 


(10.31) deben expresarse en doble precisión. 


PROBLEMAS 


10.1 Utilice las reglas de la multiplicación de matrices para demos- 
trar que las ecuaciones (10.7) y (10.8) se obtienen de la (10.6). 

10.2 a) Use la eliminación simple de Gauss para descomponer el 
sistema siguiente, de acuerdo con la descripción de la sección 10.1.2. 


10x, + 2x2, — x3 =27 
3x1 — 6x7 + 2x3 = 61.5 
Xx +x2+ 5x3 =-21.5 


Después, multiplique las matrices [£] y [U] resultantes para demos- 
trar que se genera [4]. b) Emplee la descomposición LU para resol- 
ver el sistema. Realice todos los pasos del cálculo. c) También re- 
suelva el sistema para un vector alternativo del lado derecho: (B)"= 
(12 18 6]. 

10.3 

a) Resuelva el sistema de ecuaciones siguiente por medio de la 

descomposición LU sin pivoteo. 


8x, + 4x-x3=11 
2x1 +5x,+x3=4 
2x1 —x2+6x3=7 
b) Determine la matriz inversa. Compruebe sus resultados por 
medio de verificar que [4][4]"! = [1]. 
10.4 Resuelva el sistema de ecuaciones siguiente por medio de la 
descomposición LU con pivoteo parcial: 


2x1 — 6x2 — x3 =-38 
3x1 — 2 + 7x3 =-34 
8x1 + x2- 2x3 =-20 


10.5 Determine los flops totales como función del número de ecua- 
ciones n para las fases de a) descomposición, b) sustitución hacia 
adelante y c) sustitución hacia atrás, de la versión de la descomposi- 
ción LU de la eliminación de Gauss. 

10.6 Utilice la descomposición LU para determinar la matriz inversa 
del sistema que sigue. No use una estrategia de pivoteo, y compruebe 
su resultado con la verificación de que [A][4] = [1]. 


10x, + 2x, — x3 =27 
3x, — 6x, - 2x3 =-61.5 
Xx +x, + 5x3 = 21.5 
10.7 Ejecute la descomposición de Crout sobre el sistema 
2x1 - 3x2 +x3=12 
Xx + 3x2 — X3 =-8 
3x, -4x,+2x3=16 
Después, multiplique las matrices [£] y [U] resultantes para determi- 
nar que se produce [A]. 
10.8 El sistema de ecuaciones que sigue está diseñado para determi- 
nar concentraciones (las c están en g/m?) en una serie de reactores 


acoplados, como función de la cantidad de masa que entra a cada uno 
de ellos (los lados derechos están en g/día), 


15c, -3c,— cz =3 800 
—3c, + 18c,— 6c3 = 1 200 
Ac; — C7 + 12c3 = 2 350 


a) Determine la matriz inversa. 

b) Use la inversa para encontrar la solución. 

c) Determine cuánto debe incrementarse la tasa de masa de entrada 
al reactor 3 para inducir un aumento de 10 g/m! en la concen- 
tración del reactor 1. 

d) ¿Cuánto se reduciría la concentración en el reactor 3 si la tasa 
de masa de entrada a los reactores 1 y 2 se redujera en 500 y 
250 g/día, respectivamente? 

10.9 Resuelva el siguiente sistema de ecuaciones con descomposición 
LU: 


3x1 - 2x, + x3=-10 
2x1 + 6x, — 4x3 = 44 
—x1 — 2x7 + 5x3 = -26 


10.10 a) Determine la descomposición LU para la siguiente matriz, 
sin usar una estrategia de pivoteo, y verifique sus resultados validan- 


do que [£][U] = [4]. 


8 2 1 
Y 
2.39 


b) Utilice el resultado de a) para calcular el determinante. 

c) Repita a) y b) usando MATLAB. 

10.11 Use la siguiente descomposición LU para a) calcular el de- 
terminante y b) resolver [4][x) = (b) con [by"= [-10 44 -26]. 


1 3 —2 1 
[4] =[£][U] = | 0.6667 1 7.3333 -4.6667 
0.3333 —0.3636 1 3.6364 
10.12 Determine lla E llall, y llall. para 
8 2 -10 
[4] = | -9 1 3 
15 —1 6 


Escale la matriz haciendo que el máximo elemento de cada renglón 
sea igual a uno. 

10.13 Determine las normas de Frobenius y de renglón-suma para 
los sistemas de los problemas 10.3 y 10.4. Escale las matrices igua- 
lando a uno el elemento máximo de cada renglón. 

10.14 Una matriz [4] está definida como sigue 


0.125 0.25 0.5 1 
0.015625 0.625 0.25 1 

AS 0.00463  0.02777 0.16667 1 
0.001953 0.015625 0.125 1 
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Con el uso de la norma renglón-suma, calcule el número de condición 
y cuántos dígitos sospechosos se generarían con esta matriz. 

10.15 a) Determine el número de condición para el sistema siguien- 
te por medio de la norma renglón-suma. No normalice el sistema. 


1.4 9 16 25 
4 9 16 25 36 
9 16 25 36 49 
16 25 36 49 64 
25 36 49 64 8l 


¿Cuántos dígitos de precisión se perderían debido al mal acondicio- 
namiento? b) Repita el inciso a), pero escale la matriz por medio de 
hacer el elemento más grande de cada renglón igual a uno. 

10.16 Determine el número de condición con base en la norma 
renglón-suma para la matriz de Hilbert normalizada de 5 x 5. ¿Cuán- 
tos dígitos significativos de precisión se perderían debido al mal 
acondicionamiento? 

10.17 Además de la matriz de Hilbert, hay otras matrices que son 
inherentemente mal acondicionadas. Uno de esos casos es la matriz 
de Vandermonde, que tiene la forma siguiente: 


Xx xXx 1 
2 

E O | 
2 

Xx *x 1 


a) Determine el número de condición con base en la norma renglón- 
suma para el caso en que x,=4,x,=2yx3=7. 

b) Emplee el software de MATLAB o Mathcad para calcular los 
números de condición espectral y de Frobenius. 

10.18 Desarrolle un programa amigable para el usuario para hacer 

la descomposición LU con base en el pseudocódigo de la figura 10.2. 

10.19 Realice un programa amigable para el usuario para efectuar 

la descomposición LU, que incluya la capacidad de evaluar la matriz 

inversa. Fundamente el programa en las figuras 10.2 y 10.5. 

10.20 Use técnicas iterativas de refinamiento para mejorar x, =2, x, 

=-3 y x3 = 8, que son las soluciones aproximadas de 


2x/+5x,+x3=-5 
Sx+2x2+x3=12 
x1+2x,+x3=3 
10.21 Considere los vectores siguientes: 


> 3 > 


=2i -3j+ak 


> 2 


Á 
> > 
B=bi +j-4Kk 
C 


=30 +cj+2K 


El vector Á es perpendicular al B y al C. También se sabe que B-C 
= 2. Use cualquier método de los estudiados en este capítulo para 
resolver las tres incógnitas, a, b y c. 
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10.22 Considere los vectores siguientes: 
> > 2 > 
A=ai +b]+ck 
> 


> 2 > 
B=-—2i +j-4k 


Qu 


=1 +3j+2k 


En 
donde A es un vector desconocido. Si 


(Ax B)+H(AxC)=(Sa+6) +(3b-2)j+(4c+Dk 


use cualquier método de los que aprendió en este capítulo para resol- 
ver para las tres incógnitas, a, b y c. 

10.23 Deje que la función esté definida en el intervalo [0, 2] como 
sigue: 


ax+b, 


0O<x<l 
1<x<2 


$00= (a +d, 
Determine las constantes a, b, c y d, de modo que la función fsatis- 
faga lo siguiente: 


* f0)=/0)=1. 
+ fes continua en todo el intervalo. 
* a+b=4. 


Obtenga y resuelva un sistema de ecuaciones algebraicas lineales con 
una forma matricial idéntica a la ecuación (10.1). 

10.24 a) Cree una matriz de Hilbert de 3 x 3. Ésta será la matriz [A]. 
Multiplique la matriz por el vector columna (x) =[1, 1, 1]7. La solución 
de [A](x) será otro vector columna (bj. Con el uso de cualquier 
paquete numérico y la eliminación de Gauss, encuentre la solución 
de [A](x) = ([b) por medio del empleo de la matriz de Hilbert y el 
vector [bj que calculó. Compare el resultado con su vector (x] co- 
nocido. Utilice precisión suficiente al mostrar los resultados con 
objeto de permitir detectar imprecisiones. 

b) Repita el inciso a) con el uso de una matriz de Hilbert de 7 x7. 
c) Repita el inciso a) con el uso de una matriz de Hilbert de 10x 10. 
10.25 La interpolación polinómica consiste en determinar el único 
polinomio de grado (n — 1) que se acomode a n puntos de datos. 
Tales funciones polinómicas tienen la forma general 


fo=px + pi? Pp1X + Pr (P10.25) 


donde las p son coeficientes constantes. Una forma directa de calcu- 
lar los coeficientes es generar n ecuaciones algebraicas lineales que 
se puedan resolver simultáneamente para despejar los coeficientes. 
Suponga que se quiere determinar los coeficientes de la función 
polinómica de cuarto grado f(x) = p,x* + pax? + pyx? + pax + ps que 
pasa por los siguientes cinco puntos: (200, 0.746), (250, 0.675), (300, 
0.616), (400, 0.525) y (500, 0.457). Cada uno de estos pares se 
puede sustituir en la ecuación (P10.25) para dar un sistema de cinco 
ecuaciones con cinco incógnitas (las p). Use este procedimiento para 
despejar los coeficientes. Además, determine e interprete el número de 
condición. 


Matrices especiales y el método 
de Gauss-Seidel 


Ciertas matrices tienen una estructura particular que puede aprovecharse para desarrollar esquemas 
de solución eficientes. La primera parte de este capítulo se dedica a dos de estos sistemas: matrices 
a bandas y simétricas. Se describen métodos de eliminación eficiente para ambas. 

La segunda parte de este capítulo presenta una alternativa a los métodos de eliminación, es decir, 
métodos iterativos. El enfoque se da con el método de Gauss-Seidel, el cual emplea valores iniciales 
y después itera para obtener mejores aproximaciones a la solución. El método de Gauss-Seidel es 
particularmente adecuado cuando se tiene gran número de ecuaciones. En estos casos, los métodos 
de eliminación pueden estar sujetos a errores de redondeo. Debido a que el error en el método de 
Gauss-Seidel es determinado por el número de iteraciones, el error de redondeo no es un tema que 
preocupe a este método. Sin embargo, existen ciertos ejemplos donde la técnica de Gauss-Seidel no 
convergerá al resultado correcto. Éstas y algunas otras ventajas y desventajas que se tienen entre los 
métodos de eliminación e iterativos se analizarán en las páginas siguientes. 


11.1 MATRICES ESPECIALES 


Como se mencionó en el cuadro PT3.1, una matriz a bandas es una matriz cuadrada en la que todos 
sus elementos son cero, con excepción de una banda centrada sobre la diagonal principal. Los siste- 
mas a bandas se encuentran con frecuencia en la práctica científica y de la ingeniería. Por ejemplo, 
tales sistemas aparecen en la solución de ecuaciones diferenciales. Además, otros métodos numéri- 
cos como el de los splines cúbicos (sección 18.5) involucran la solución de sistemas a bandas. 

Las dimensiones de un sistema a bandas se cuantifica mediante dos parámetros: el ancho de 
banda (BW, por sus iniciales en inglés) y el ancho de media banda HBW (figura 11.1). Estos dos 
valores se relacionan mediante BW = 2HBW + 1. En general, un sistema a bandas es aquel para el 
cual a, =0 si li ¿| > HBW. 

Aunque la eliminación de Gauss o la descomposición LU convencional se emplean para resolver 
sistemas de ecuaciones bandeados, resultan ser ineficientes, debido a que si el pivoteo no es necesa- 
rio, ninguno de los elementos fuera de la banda cambiará su valor original igual a cero. Así, no será 
necesario utilizar tiempo y espacio en el almacenamiento y en el manejo de estos ceros inútiles. Si 
se sabe de antemano que el pivoteo no es necesario, se pueden desarrollar algoritmos muy eficientes 
en los que no intervengan los ceros fuera de la banda. Como en muchos problemas 
con sistemas a bandas, no se requiere el pivoteo; los algoritmos alternos, que se 
describirán a continuación, son los métodos seleccionados para tal fin. 


HBW + 1 


11.1.1 Sistemas tridiagonales 


Un sistema tridiagonal (es decir, uno con un ancho de banda 3) se expresa en forma 
general de la siguiente manera: 


Figura 11.1 
Parámetros utilizados para cuantificar las dimensiones de un sistema a bandas. BW y 
HBW designan el ancho de banda y el ancho de media banda, respectivamente. 
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a) Descomposición h 2 E h 
DOFOR k A n es E Ls Es ñ 
€ = Ex Tri 
Fe = Fe €" 9 sf 8s e Él 
END DO o 
b) Sustitución hacia adelante 
DOFOR k= 2, n 
Pe = Pi €" Fi Cr-1 La 8n-1 An -1 m1 
END DO L E bo A 


c) Sustitución hacia atrás 


X= Pala 
DOFOR k=n - 1, 1, -1 
X= (MO ls 


(11.1) 


Observe que se ha cambiado la notación para los coeficientes; en lugar de a y b usamos e, 
f. g y r. Esto se hace para evitar guardar un gran número de ceros que no se utilizan en la 
matriz cuadrada de las a. Esta modificación es ventajosa para ahorrar espacio, ya que el 


abidid algoritmo resultante requiere menos memoria de cómputo. 
Figura 11.2 En la figura 11.2 se muestra el pseudocódigo de un método eficiente, llamado algorit- 
Pseudocódigo para implementar Mo de Thomas, para resolver la ecuación (11.1). Como una descomposición LU convencio- 
el algoritmo de Thomas, un mé- nal, el algoritmo consiste de tres pasos: descomposición, sustitución hacia adelante y 
todo de descomposición LU para sustitución hacia atrás. Así, las ventajas de la descomposición LU, como la evaluación de 
sistemas tridiagonales. vectores múltiples del lado derecho y el cálculo de la matriz inversa, se obtienen mediante 


una apropiada aplicación de este algoritmo. 


EJEMPLO 11.1 Solución tridiagonal con el algoritmo de Thomas 


Planteamiento del problema  Resuelva el siguiente sistema tridiagonal con el algoritmo de Thomas. 


2.04 -1 TV (40.8 
1 204 -1 mI (08 
+ 20€ LIO 

1 204 |7,) [200.8 


Solución Primero, la descomposición se realiza así: 
e, = -1/2.04 = 0.49 
f,= 2.04 — (20.491) = 1.550 
e, = -1/1.550 = -0.645 
f,= 2.04 — (-0.645)-1) = 1.395 
e, = -1/1.395 = 0.717 
f,= 2.04 — (-0.717)41) = 1.323 
Así, la matriz se transforma en 
2.04 -1 
0.49 1.550 -1 


0.645 1.395  -—1 
0.717 1.323 


y la descomposición LU es 
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1 2.04  -—1 
0,49 1 1.550  -—1 
Ñ 0.645 1 1.395  -1 
0.717 1 1.323 
Se puede verificar que ésta sea correcta al multiplicar [L][U] para obtener [4]. 
La sustitución hacia adelante se realiza de la siguiente manera: 
r, = 0.8 — (-0.49)40.8 = 20.8 
r3=0.8 — (0.645)20.8 = 14.221 
r,¿= 200.8 — (-0.717)14.221 = 210.996 
De esta forma, el vector del lado derecho se modifica a 
40.8 
20.8 
14.221 
210.996 


el cual, entonces, se utiliza de manera conjunta con la matriz [U], para realizar la sustitución hacia 
atrás y obtener la solución 


T, = 210.996/1.323 = 159.480 
T;, = [14.221 - (-1)159.48]/1.395 = 124.538 
T, = [20.800 — (-1)124.538]/1.550 = 93.778 


T, = [40.800 — (-1)93.778]/2.040 = 65.970 


11.1.2 Descomposición de Cholesky 


Recuerde del cuadro P'T3.1, que una matriz simétrica es aquella donde a,, = a;, para toda i y j. En 
otras palabras, [4] = [4]”. Tales sistemas se presentan comúnmente en problemas de contexto mate- 
mático y de ingeniería. Estas matrices ofrecen ventajas computacionales, ya que únicamente se 
necesita la mitad de espacio de almacenamiento y, en la mayoría de los casos, sólo se requiere la 
mitad del tiempo de cálculo para su solución. 

Uno de los métodos más populares usa la descomposición de Cholesky. Este algoritmo se basa 
en el hecho de que una matriz simétrica se descompone así: 


[A] = [L][LY” (11.2) 


Es decir, los factores triangulares resultantes son la transpuesta uno de otro. 

Los términos de la ecuación (11.2) se desarrollan al multiplicar e igualar entre sí ambos la- 
dos. El resultado se expresa en forma simple mediante relaciones de recurrencia. Para el renglón 
k-ésimo, 

i-1 


a, 1 


i oki 


L, =—=E-— parai=1,2,...,k-1 (11.3) 


la =. 18. dle (11.4) 
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EJEMPLO 11.2 Descomposición de Cholesky 


Planteamiento del problema Aplique la descomposición de Cholesky a la matriz simétrica 


6 15 55 
[4]=|15 55 225 
55 225 979 


Solución Para el primer renglón (k = 1), no se toma en cuenta la ecuación (11.3) y se emplea la 
ecuación (11.4) para calcular 


L,, =-/a,, = 16 = 2.4495 


Para el segundo renglón (k = 2), con la ecuación (11.3) se obtiene 


y con la ecuación (11.4) resulta 


ly) = ya, bh = .(55-(6.1237) = 4.1833 


Para el tercer renglón (k = 3), la ecuación (11.3) con ¡ = 1 da como resultado 


o A 
ll 2.4495 
y con (i=2) 
y, = “as lala - 225-6.123702:454) _ 29.917 


18 4.1833 


en la ecuación (11.4) se obtiene 


L,, = a/a, - E, E, =+/979-(22.454) - (20.917) =6.1101 


De esta forma, la descomposición de Cholesky queda como 


2.4495 
[L]=[ 6.1237 4.1833 
22.454 20.917 6.1101 


Se verifica la validez de esta descomposición al sustituirla junto con su transpuesta en la ecua- 
ción (11.2) y ver que del producto resulta la matriz original [4]. Esto se deja como ejercicio para el 
lector. 


En la figura 11.3 se presenta el pseudocódigo para el algoritmo de la descomposición de Cholesky. 
Debe observar que el algoritmo de la figura 11.3 da un error de ejecución si en la evaluación de ay, se 
obtiene la raíz cuadrada de un número negativo. Sin embargo, cuando la matriz es definida positiva, 


'Una matriz definida positiva es aquella para la cual el producto ([X)"[4](X) es mayor que cero, para todo vector (X) distinto 
de cero. 


11.2 Gauss-Seidel 241 


esto nunca ocurrirá. Debido a que muchas de las matrices simétricas que se usan en ingeniería son  DOFOR k = 1, n 

de hecho definidas positivas, el algoritmo de Cholesky tiene una amplia aplicación. Otro beneficio DOFOR 1= 1, k - 1 
al trabajar con matrices simétricas definidas positivas es que no se requiere el pivoteo para evitar LIM 0. : 

la división entre cero. Así, es posible implementar el algoritmo de la figura 11.3 sin la complicación asii Mi 


: sum = sum + aa 
del pivoteo. y ed 


END DO 

de = (a - sum)/a;; 
11.2 GAUSS-SEIDEL END DO 
Hoc — o o —  — — e sum = 0. 
Los métodos iterativos constituyen una alternativa a los métodos de eliminación descritos has-  DOFOR j = 1, k - 1 
ta ahora, para aproximar la solución. Tales métodos son similares a las técnicas que se desarro- sum = sum + a, 


llaron en el capítulo 6 para obtener las raíces de una sola ecuación. Aquellos métodos consistían END DO 
en suponer un valor y luego usar un método sistemático para obtener una aproximación mejo- x= Vd - Sum 
rada de la raíz. Como esta parte del libro trata con un problema similar (obtener los valores que ENO BO 
simultáneamente satisfagan un conjunto de ecuaciones). Entonces se esperaría que tales métodos 
aproximados fuesen útiles en este contexto. Sn 
z ; z ; : z E Pseudocódigo para el 
El método de Gauss-Seidel es el método iterativo más comúnmente usado. Suponga que se : ; 

a ll den algoritmo de descomposi- 

AAA An : ción LU de Cholesky. 


[AJ(X) = (B) 


Figura 11.3 


Suponga que se limita a un conjunto de ecuaciones de 3 x 3. Si los elementos de la diagonal no 
son todos cero, la primera ecuación se puede resolver para x,, la segunda para x, y la tercera para 
X3, para obtener 

b, = 4y7X) = 013%; 


x= (11.5a) 
4; 


b, — 4)¡X, — 0,3X, 


x, = (11.5b) 
da 
b,—4, Xx, —0,,X 
x,= 3 7 434] — dz7X, (11.50) 
A33 


Ahora, se puede empezar el proceso de solución al escoger valores iniciales para las x. Una 
forma simple para obtener los valores iniciales es suponer que todos son cero. Estos ceros se susti- 
tuyen en la ecuación (11.5a), la cual se utiliza para calcular un nuevo valor x, = b,/a,,. Después, se 
sustituye este nuevo valor de x, junto con el valor previo cero de x, en la ecuación (11.5b) y se cal- 
cula el nuevo valor de x,. Este proceso se repite con la ecuación (11.5c) para calcular un nuevo valor 
de xz. Después se regresa a la primera ecuación y se repite todo el procedimiento hasta que la solución 
converja suficientemente cerca a los valores verdaderos. La convergencia se verifica usando el cri- 
terio [recuerde la ecuación (3.5)] 


i 


100% < €, (11.6) 


S 
Xi —X/ 
Jj 


para todas las ¿, donde j y ¡— 1 son las iteraciones actuales y previas, respectivamente. 


EJEMPLO 11.3 Método de Gauss-Seidel 


Planteamiento del problema Use el método de Gauss-Seidel para obtener la solución del 
sistema usado en el ejemplo 10.2: 
3x, -0.1l1,-0.21,= 7.85 
0.1x, + 7x, — 0.3x, = -19.3 
0.3x,-0.2x, + 10x,= 71.4 


Recuerde que la solución exacta es x, =3,x,=-2.5 y x,=7. 
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Solución Primero, despeje la incógnita sobre la diagonal para cada una de las ecuaciones. 


y T85+0.1x, +02x, 


z (E11.3.) 

¿E -19.3—0.1x, +0.3x, (E11.3.2) 
7 

pS 71.4— a +0.2x, (E11.3.3) 


Suponiendo que x, y x3 son cero, se utiliza la ecuación (E11.3.1) para calcular 


el 
as PR =2.616667 


Este valor, junto con el valor de xz = 0, se sustituye en la ecuación (E11.3.2) para calcular 


-19.3- 0.12.616667) +0 
X> = = 
7 
La primera iteración termina al sustituir los valores calculados para x, y x, en la ecuación (E11.3.3) 
para dar 


2.194524 


y — 71.4-0.30.616667)+0.2-2.794524) 


3 ="7.005610 
j 10 


En la segunda iteración, se repite el mismo proceso para calcular 


ca E 7.85+0.1(22.794524)+0.2(7.005610) 


1 z =2.990557 le, | = 0.31% 
els 103= a NS odo 
y, = 71.4 0.3(2.990557) + 0.2(-2.499625) _ - 009701 is 


ú 10 


El método es, por lo tanto, convergente hacia la verdadera solución. Es posible aplicar iteraciones 
adicionales para mejorar los resultados. Sin embargo, en un problema real, no se podría saber a 
priori el resultado correcto. En consecuencia, la ecuación (11.6) nos da un medio para estimar el 
error. Por ejemplo, para x, 


100% =12.5% 


B | 2.990557—2.616667 
a 2.990557 


Para x, y x3, los errores estimados son le, | = 11.8% y le, al = 0.076%. Observe que, como cuando 
se determinaron las raíces de una sola ecuación, las formulaciones como la ecuación (11.6) usual- 
mente ofrecen una valoración conservativa de la convergencia. Así, cuando éstas se satisfacen, 
aseguran que el resultado se conozca con, al menos, la tolerancia especificada por €,. 


Conforme un nuevo valor de x se calcula con el método de Gauss-Seidel, éste se usa inmedia- 
tamente en la siguiente ecuación para determinar el otro valor de x. De esta forma, si la solución es 
convergente, se empleará la mejor aproximación disponible. Un método alternativo, llamado ¡tera- 
ción de Jacobi, emplea una táctica algo diferente. Más que usar inmediatamente el último valor 
disponible de x, esta técnica usa la ecuación (11.5) para calcular un conjunto de nuevas x con base 
en un conjunto de x anteriores. De esta forma, conforme se generan nuevos valores, no se usan en 
forma inmediata sino que se retienen para la siguiente iteración. 


La diferencia entre el método de Gauss-Seidel y la iteración de 
Jacobi se muestra en la figura 11.4. Aunque hay ciertos casos don- 
de es útil el método de Jacobi, la utilización de Gauss-Seidel da la 
mejor aproximación y usualmente lo hace el método preferido. 


11.2.1 Criterio de convergencia para el método 
de Gauss-Seidel 


Observe que el método de Gauss-Seidel es similar en esencia a la 
técnica de iteración de punto fijo que se usó en la sección 6.1 para 
obtener las raíces de una sola ecuación. Recuerde que la iteración 
de punto fijo presenta dos problemas fundamentales: 1) en algunas 
ocasiones no es convergente, y 2) cuando converge, con frecuencia 
lo hace en forma muy lenta. El método de Gauss-Seidel puede 
también presentar estas desventajas. 

El criterio de convergencia se puede desarrollar al recordar 
de la sección 6.5.1 que las condiciones suficientes para la conver- 
gencia de dos ecuaciones no lineales, u(x, y) y v(x, y), son 


du 


du|, ¡du 
Ox 


+ <1l (11.7a) 


dv 


A+ A < 1 
Ox 


11.2 Gauss-Seidel 


Primera iteración 


X1= (b1 — a12X2 — a13%3)/ a11 


X2 = (b2 — a21X1 — a23X3)/ a22 


23 = (b3 — a31X1 — a32X2)/ a33 


segunda iteración 


Xx1 = (b1 — a12X2 — a13%3)/ a11 


X2 = (07 — a21X1 — a23X3)/ a22 
23 = (b3 — a31X1 — a32X2)/ a33 


a) 


Figura 11.4 


= (01 — a12X2 — a13X3)/ a11 


X2|= (b2 — a21X1 — a23X3)/ a22 


X3)= (b3 — a31X1 — a32X2)/ a33 


AÁh 22225 
X1 =(b1 — a12X2 — a13%3)/ a11 
X2 = (07 — a21X1 — a23X3)/ a22 


X3 = (b3 — a31X1 — d32X2)/ a33 
b) 


Ilustración de la diferencia entre los métodos i¡terativos a) 
Gauss-Seidel y b) Jacobi para resolver ecuaciones algebrai- 


cas simultáneas lineales. 


(11.7b) 


Este criterio se aplica también a las ecuaciones lineales que se resuelven con el método de Gauss- 
Seidel. Por ejemplo, en el caso de dos ecuaciones simultáneas, el algoritmo de Gauss-Seidel [ecuación 


(11.5)] se expresa como 


b a 
A 12 
U(X|, Xx) = === X) 
Mm 4% 
y 
b a 
2 21 
v(x,,x,) = =-=—= x, 
2 Uy» 


(11.8a) 


(11.8b) 


Las derivadas parciales de estas ecuaciones se evalúan con respecto a cada una de las incógnitas así: 


du en du 4, 

dx; Ox, a; 
y 

dv _ 4, du =0 

ox, Aa) Ox, 


que se sustituyen en la ecuación (11.7) para dar 


| 4) 


S 
E 


(11.9a) 


(11.9b) 
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Figura 11.5 


Representación a) de la convergencia y b) de la diver- 
gencia del método de Gauss-Seidel. Observe que las 
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mismas funciones son dibujadas en ambos casos (u: E A 


11x, + 13x, = 286; v: 11x, — 9x, = 99). Así, el orden en js 
el cual se implementan las ecuaciones (se representa por 
la dirección de la primera flecha desde el origen) deter- 


mina si el cálculo converge. a) b) 


En otras palabras, el valor absoluto de las pendientes en la ecuación (11.8) debe ser menor que 
la unidad para asegurar la convergencia, lo cual se muestra gráficamente en la figura 11.5. La ecua- 
ción (11.9) también se reformula así: 


la,,| > la, | 


la! > la,,| 


Esto es, el elemento diagonal debe ser mayor que el elemento fuera de la diagonal para cada renglón. 
La generalización de lo anterior para n ecuaciones es directa y se expresa como 


la, > Y EM (11.10) 


Es decir, el coeficiente diagonal en cada una de las ecuaciones debe ser mayor que la suma del valor 
absoluto de los otros coeficientes de la ecuación. Este criterio es suficiente pero no necesario para 
la convergencia. Es decir, el método puede funcionar aunque no se satisfaga la ecuación (11.10), la 
convergencia se garantiza cuando la condición se satisface. A los sistemas que cumplen con la ecua- 
ción (11.10) se les conoce como diagonalmente dominantes. Por fortuna, en la ingeniería, muchos 
problemas de importancia práctica satisfacen este requerimiento. 


11.2.2 Mejoramiento de la convergencia usando relajación 


La relajación representa una ligera modificación al método de Gauss-Seidel y ésta permite mejorar 
la convergencia. Después de que se calcula cada nuevo valor de x por medio de la ecuación (11.5), 
ese valor se modifica mediante un promedio ponderado de los resultados de las iteraciones anterior 
y actual: 


Decó = Ax puevo + a _ Apo a 1.1 D) 


donde A es un factor ponderado que tiene un valor entre 0 y 2. 

Si4 = 1, (1 —4) es igual a 0 y el resultado no se modifica. Sin embargo, si a A se le asigna un 
valor entre O y 1, el resultado es un promedio ponderado de los resultados actuales y anteriores. Este 
tipo de modificación se conoce como subrelajación. Se emplea comúnmente para hacer que un 
sistema no convergente, converja o acelere la convergencia al amortiguar sus oscilaciones. 

Para valores A de 1 a 2, se le da una ponderación extra al valor actual. En este caso, hay una su- 
posición implícita de que el nuevo valor se mueve en la dirección correcta hacia la solución verdade- 
ra, pero con una velocidad demasiado lenta. Por lo tanto, se pretende que la ponderación adicional de 
A mejore la aproximación al llevarla más cerca de la verdadera. De aquí que este tipo de modificación, 
al cual se le llama sobrerrelajación, permite acelerar la convergencia de un sistema que ya es conver- 
gente. El método también se conoce como sobrerrelajación simultánea O sucesiva, O SOR. 


La elección de un valor adecuado de 4 es especificado por el 
problema y se determina en forma empírica. Para la solución de un 
solo sistema de ecuaciones, con frecuencia es innecesaria. No obs- 
tante, si el sistema bajo estudio se va a resolver de manera repetida, 
la eficiencia que se introduce por una prudente elección de A puede 
ser extremadamente importante. Buenos ejemplos de lo anterior son 
los sistemas muy grandes de ecuaciones diferenciales parciales, que 
frecuentemente se presentan cuando se modelan variaciones conti- 
nuas de variables (recuerde el sistema distribuido que se mostró en 
la figura PT3.1b). Se retomará el tema en la parte ocho. 


11.2.3 Algoritmo para el método de Gauss-Seidel 


En la figura 11.6 se muestra un algoritmo para el método de Gauss- 
Seidel con relajación. Observe que este algoritmo no garantiza la 
convergencia si las ecuaciones no se introducen en una forma diago- 
nalmente dominante. 

El pseudocódigo tiene dos características que vale la pena men- 
cionar. La primera es que existe un conjunto inicial de ciclos anidados 
para dividir cada ecuación por su elemento diagonal. Esto reduce el 
número total de operaciones en el algoritmo. En la segunda, observe 
que la verificación del error se designa por una variable llamada 
sentinel. Si en cualquiera de las ecuaciones se tiene un error aproxi- 
mado mayor que el criterio de paro (e,), entonces se permite con- 
tinuar con las iteraciones. El uso de la variable de estado ayuda a 
evitar cálculos innecesarios de estimación de error una vez que las 
ecuaciones excedan el criterio. 


11.2.4 Contextos del problema en el método de 
Gauss-Seidel 


Además de evitar el problema de redondeo, la técnica de Gauss- 
Seidel tiene muchas otras ventajas que la hacen particularmente 
atractiva en el contexto de ciertos problemas de ingeniería. Por ejem- 
plo, cuando la matriz en cuestión es muy grande y esparcida (es 
decir, cuando la mayoría de los elementos son cero), los métodos de 
eliminación desperdician grandes cantidades de memoria de cómpu- 
to al guardar ceros. 

Al inicio de este capítulo se vio cómo esta desventaja se puede 
evitar si la matriz de coeficientes es a bandas. Para sistemas que no 
tienen la forma de banda, generalmente no existe una forma simple 
para evitar los grandes requerimientos de memoria cuando se utilizan 
los métodos de eliminación. Como todas las computadoras tienen 
una cantidad de memoria finita, esta ineficiencia llega a poner una 
limitación al tamaño de los sistemas, para los cuales los métodos de 
eliminación resultan prácticos. 


11.2 Gauss-Seidel 245 


SUBROUTINE Gseid (a,b,n,x, imax,es, lambda) 
DOFOR 1 = 1,n 
dummy = a;; 
DOFOR j = 1,n 
dj; = a, ¿/dummy 
END DO 
b, = b;/dummy 
END DO 
DOFOR ¡1 = 1, n 
sum = b; 
DOFOR j= 1, n 
IF ij THEN sum = sum - a 
END DO 
x¡;=sum 
END DO 
iter=1 
DO 
sentinel=1 
DOFOR 1 = 1,n 
old = Xx; 


NE 
Aj 


sum = b; 
DOFOR j = 1,n 
IF 14] THEN sum = sum - a; 
END DO 
Xx, = lambda*sum +(1.-lambda)*old 
IF sentinel = 1 AND x, + 0. THEN 
ea = ABS((x, - anterior)/x,)*100. 
IF ea > es THEN sentinel = 0 
END 1F 
END DO 
1Ler = 1terek 1 
IF sentinel = 1 OR (¡ter 2 imax) EXIT 
END DO 
END Gseid 


A 
GA 


Figura 11.6 
Pseudocódigo para el método de Gauss-Seidel con re- 
lajación. 


Aunque un algoritmo general como el de la figura 11.6 es propenso a la misma restricción, la 
estructura de las ecuaciones de Gauss-Seidel [ecuación (11.5)] permite que se desarrollen programas 
concisos para sistemas específicos. Como sólo se necesita incluir coeficientes que no sean cero en 
la ecuación (11.5), es posible lograr grandes ahorros en la memoria de la computadora. Aunque esto 
implica más inversión en el desarrollo de software, las ventajas a largo plazo son sustanciales cuan- 
do se tiene grandes sistemas, en los cuales se ejecutan muchas simulaciones. Tanto sistemas de va- 
riables localizadas como distribuidas pueden dar como resultado matrices grandes y muy esparcidas 


donde el método de Gauss-Seidel tiene utilidad. 
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11.3 ECUACIONES ALGEBRAICAS LINEALES 
CON PAQUETES DE SOFTWARE 


Los paquetes de software tienen grandes capacidades para resolver sistemas de ecuaciones algebrai- 
cas lineales. Antes de describir dichas herramientas, se debe mencionar que los procedimientos 
descritos en el capítulo 7 para resolver sistemas de ecuaciones no lineales pueden aplicarse a sistemas 
lineales. Sin embargo, en esta sección enfocaremos nuestra atención hacia procedimientos que están 
expresamente diseñados para ecuaciones lineales. 


11.3.1 Excel 


Existen dos formas para resolver ecuaciones algebraicas lineales con Excel: 1) por medio de la he- 
rramienta Solver o 2) usando la inversión de matrices y las funciones de multiplicación. 
Recuerde que una forma para determinar la solución de ecuaciones algebraicas lineales es 


(X) =[AT" (B) (11.12) 


Excel tiene funciones predeterminadas para inversión y multiplicación de matrices que sirve para 
implementar esta fórmula. 


EJEMPLO 11.4 Uso de Excel para resolver sistemas lineales 


Planteamiento del problema Recuerde que en el capítulo 10 se presentó la matriz de Hilbert. 
El siguiente sistema se basa en esta matriz. Observe que está escalado, como se realizó antes en el 
ejemplo 10.3, de tal forma que el coeficiente máximo en cada renglón es la unidad. 


1 1/2 1/3 Xx; 1.833333 
1 2/3 1/2 Xx, y =32.166667 


1 3/4 3/5 X, 2.35 


La solución a este sistema es (X)"= [1 1 1]. Use Excel para obtener esta solución. 


Solución La hoja de cálculo para resolver este problema se muestra en la figura 11.7. Primero, la 
matriz [4] y las constantes del lado derecho (B] se introducen en las celdas de la hoja de cálculo. 
Después, se resalta un conjunto de celdas de dimensiones apropiadas (en este ejemplo 3 x 3), ya sea 
presionando y arrastrando el ratón o por medio de las teclas direccionales mientras se presiona la 
tecla shift. Como se muestra en la figura 11.7, se resalta el rango: B5..D7. 

Ahora, se introduce una fórmula que invoca a la función matriz inversa, 


=minverse(B1..D3) 


Observe que el argumento es el rango que contiene los elementos de [4]. Las teclas Ctrl y Shift se 
mantienen presionadas mientras se oprime la tecla Enter. La inversa resultante de [4] se calculará 
con Excel para desplegarse en el rango BS. .D7 como se muestra en la figura 11.7. 

Un procedimiento similar se utiliza para multiplicar la inversa por el vector del lado derecho. 
En este caso, el rango de E5..F7 se resalta y se introduce la siguiente fórmula 


=mmult (B5..D7, F1..F3) 


donde el primer rango es la primera matriz que habrá de multiplicarse, [4]”, y el segundo rango es 
la segunda matriz a multiplicarse, (B]. De nuevo, al usar la combinación Ctrl-Shift-Enter, la solución 
(X) se calculará por Excel y desplegada en el rango FS. .F7, como se muestra en la figura 11.7. Como 
puede verse, se obtiene la respuesta correcta. 


11.3 Ecuaciones algebraicas lineales con paquetes de software 


A B C D E F 

1 1 0.5 | 0.33333333 1.83333333333333 
2 [A]= 1 |0.66666667 0.5 (B)= 2.16666666666667 
$) 1 0.75 0.6 2.35000000000000 
4 
5 9 -18 10 0.99999999999992 
6 | [A]-1 = —-36 96 60  (X)= 1.00000000000043 
7 30 —90 60 0.99999999999960 

=MINVERSE(B1:D3) =MMULT(B5:D7,F1:F3) 

Figura 11.7 


Observe que en forma deliberada se reformatearon los resultados en el ejemplo 11.4 para mostrar 
15 dígitos. Esto se hizo debido a que Excel usa doble precisión para guardar valores numéricos. De 
esta forma, se observa que el error de redondeo ocurre en los últimos dos dígitos. Esto implica un 
número de condición del orden de 100, el cual concuerda con el resultado de 451.2 que originalmen- 
te se calculó en el ejemplo 10.3. Excel no tiene la capacidad para calcular un número de condición. 
En la mayoría de los casos, debido a que Excel emplea números con doble precisión, esto no repre- 
senta un problema. Sin embargo, en casos donde se sospeche que el sistema esté mal condicionado, 
la determinación del número de condición es útil. MATLAB y Mathcad tienen la capacidad de 
calcular esta cantidad. 


11.3.2 MATLAB 


Como su nombre lo indica, MATLAB (contracción de MATrix LA Boratory) se diseñó para facilitar 
el manejo de matrices. Así, como es de esperarse, sus capacidades en esta área son excelentes. Al- 
gunas funciones de MATLAB relacionadas con las operaciones de matrices se presentan en una 
lista en la tabla 11.1. El ejemplo siguiente ilustra algunas de dichas capacidades. 


EJEMPLO 11.5 Uso de MATLAB para manipular ecuaciones algebraicas lineales 


Planteamiento del problema Explore cómo MATLAB se puede emplear para resolver y ana- 
lizar ecuaciones algebraicas lineales. Use el mismo sistema que en el ejemplo 11.4. 


Solución Primero, introducimos la matriz [4] y el vector (B), 


> A= [1 1/2 1/3 ; 1 2/3 2/4 ; 1 3/4 3/5 1] 


A = 

1.0000 0.5000 0.3333 

1.0000 0.6667 0.5000 

1.0000 0.7500 0.6000 
>> B=[1+1/2+1/3;1+2/3+2/4;1+3/4+3/5] 
B= 

1.8333 

2.1667 

2.3500 


Después, se determina el número de condición para [4] 
>> cond(A) 


ans = 
366.3503 
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Tabla 11.1 Funciones de MATLAB para el análisis matricial y el álgebra lineal numérica. 


Análisis matricial Ecuaciones lineales 
Función Descripción Función Descripción 
cond Número de condición de una matriz Vand/ Solución de una ecuación lineal; use “help slash” 
norm Norma vectorial o matricial chol Factorización de Cholesky 
rcond Estimador de condición recíproca LINPACK lu Factores para la eliminación de Gauss 
rank Número de renglones o columnas inv Matriz inversa 
linealmente independientes 

det Determinante gr Descomposición ortogonal-triangular 
trace Suma de los elementos en la diagonal ardelete Suprime una columna de la 

factorización QR 
null Espacio nulo grinsert Inserte una columna en la factorización QR 
orth Ortogonalización nnls Mínimos cuadrados no negativos 
rref Forma escalonada reducida por renglones pinv Pseudoinversa 

Iscov Mínimos cuadrados en la presencia 
de covarianza conocida 


Este resultado se basa en la norma espectral, o ||A|,, que se analizó en el cuadro 10.2. Observe que 
es del mismo orden de magnitud que el número de condición = 451.2, basado en la norma renglón- 
suma del ejemplo 10.3. Ambos resultados implican que se podrían perder entre 2 y 3 dígitos de 
precisión. 

Ahora se puede resolver el sistema de ecuaciones en dos formas diferentes. La forma más di- 
recta y eficiente consiste en emplear el símbolo A, o “división izquierda”: 


>> X=AB 

X = 
1.0000 
1.0000 
1.0000 


Como en los casos anteriores, MATLAB usa la eliminación de Gauss para resolver dichos sistemas. 
Como una alternativa, se puede resolver la ecuación (PT3.6) en forma directa, como 


>> X=inv(A)*B 


X= 
1.0000 
1.0000 
1.0000 


Este procedimiento determina primero la matriz inversa y después ejecuta la multiplicación matricial. 
Por lo tanto, toma más tiempo que la operación de división izquierda. 


11.3.3 Mathcad 


Mathcad contiene muchas funciones especiales que manipulan vectores y matrices. Esto incluye 
Operaciones ordinarias como producto punto, transposición de matrices, suma de matrices y multi- 
plicación de matrices. Además, permite el cálculo de inverso de matriz, determinante, traza, diver- 
sos tipos de normas y números de condición con base en diferentes normas. También tiene varias 
funciones que descomponen matrices. 


11.3 Ecuaciones algebraicas lineales con paquetes de software 


Se pueden resolver sistemas de ecuaciones lineales de dos maneras por Mathcad. Primero, es 
posible usar la inversión de matriz seguida por multiplicación por el lado derecho como se explicó en 
el capítulo 10. Además, Mathcad tiene una función especial que se llama Isolve(A,b) que está especí- 
ficamente diseñada para resolver ecuaciones lineales. Usted puede usar otras funciones incorporadas 
para evaluar la condición de A y determinar si A es casi singular y, por lo tanto, posiblemente sujeta 
a errores de redondeo. 

Como ejemplo, se usará Isolve para resolver un sistema de ecuaciones lineales. Como se mues- 
tra en la figura 11.8, el primer paso es introducir los coeficientes de la matriz A, usando el símbolo 
de definición y el menú desplegable Insert/Matrix. Esto da una caja de diálogo que le permite espe- 
cificar las dimensiones de la matriz. Para el presente caso, se seleccionará una dimensión de 4 x 4, 
y Mathcad coloca una matriz en blanco de tamaño 4 x 4 en la pantalla. Ahora simplemente haga clic 
en la ubicación de la celda adecuada e introduzca los valores. Repita operaciones similares para crear 
el vector del lado derecho b. Ahora, el vector x se define como Isolve(A,b), y el valor de x se mues- 
tra con el signo de igual. 

También se puede resolver el mismo sistema usando la inversa de la matriz. La inversa se pue- 
de simplemente calcular con sólo elevar A al exponente —1. El resultado se muestra en el lado dere- 
cho de la figura 11.8. La solución se genera entonces como el producto de la inversa por b. 

En seguida, se va a usar Mathcad para encontrar la inversa y el número de condición de la ma- 
triz de Hilbert. Como en la figura 11.9, la matriz escalada se puede introducir usando el símbolo de 
definición y el menú desplegable Insert/Matrix. Nuevamente, es posible calcular la inversa simple- 
mente elevando H al exponente —1. El resultado se muestra en la figura 11.9. Se pueden entonces usar 
algunas otras funciones de Mathcad para determinar números de condición usando el símbolo de 
definición para definir las variables cl, c2, ce y ci como número de condición, basado en las normas 
de suma de columnas (condl), espectral (cond2), euclidiana (conde) y suma de hileras (condi), 
respectivamente. Los valores resultantes se muestran en la parte inferior de la figura 11.9. Como se 
esperaría, la norma espectral proporciona la medición más pequeña de la magnitud. 


"M1 Mathcad 


MI File Edit View Irsert Format Tools Symbolis Window. Help 


SOLVING A SYSTEM OF LINEAR ALGEBRAIC EQUATIONS 


Enter a matrix and right-hand-side vector corresponding to h equations with n unknowns! 
0.3 0.2 66 —1.1 1 
45 1.8 0.3 6.5 b:=| 0.1 


7.3 9.7 10.9 4.1 0.01 
8.1 2.7 87 89 0.001 


(a) Generate solution with Isolve: (b) Generate solution with Inverse: 


x := Isolve(A,b) xx = AT: b 


— 3.937 - 3.937 
2.975 - 2.975 

¿>| 0.746 £¿=| 0.746 
1.952 1.952 


Figura 11.8 
Pantalla Mathcad para resolver un sistema de ecuaciones algebraicas lineales. 
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MI Fie Edit View  Irsert Format Tools Symbolics Window Help 


CALCULATING THE INVERSE AND CONDITION NUMBERS 


c2 :=cond2(H) 
02 = 366.35 


0.3333333 
0.5 
0.6 


ce :=conde(H) 
ce= 368.087 


ci :=condi(H) 
ci= 451,2 


Pantalla Mathcad para determinar la inversa de la matriz y números de condición de una matriz Hilbert 


250 Capítulo 11 
"A Mathcad 
Enter a scaled Hilbert matrix 
1 0.5 
1 0.6666667 
1 0.75 
Calculate matrix ¡nverse 
1:= q 
9 —18 10 
36 9%6 —<60 
30 —0 60 
Calculate conditton numbers: 
cl:= condl(H) 
cl =612 
Figura 11.9 
escalada de 3 x 3. 
PROBLEMAS 


11.1 Realice los mismos cálculos como en a) ejemplo 11.1 y b) 
ejemplo 11.3, pero para el sistema tridiagonal. 


0.8 -—0.4 Xx 41 
04 08 -—04|3x,p=3 25 
0.4 0.8 |[x, 105 
11.2 Determine la matriz inversa del ejemplo 11.1 con base en la 
descomposición LU y los vectores unitarios. 
11.3 El sistema tridiagonal que sigue debe resolverse como parte de 


un algoritmo mayor (Crank-Nicolson) para solucionar ecuaciones 
diferenciales parciales: 


2.01475  -0.020875 
-0.020875  2.01475  -0.020875 

-0.020875  2.01475  -0.020875 

-0.020875  2.01475 

T, 4.175 

T 0 

Xx 7, = ñ 

T, 2.0875 


Utilice el algoritmo de Thomas para obtener una solución. 
11.4 Confirme la validez de la descomposición de Cholesky del 
ejemplo 11.2 por medio de sustituir los resultados en la ecuación 


(11.2) con objeto de ver si el producto de [£] y [L]” da como resul- 
tado [A]. 

11.5 Haga los mismos cálculos que en el ejemplo 11.2, pero para el 
sistema simétrico que sigue: 


6 15 557(a, 152.6 
15 55 225|4a,)=+4 585.6 
55 225 979] la, 2.488.8 


Además de resolver para la descomposición de Cholesky, empléela 
para solucionar cuál es el valor de las a. 

11.6 Ejecute a mano la descomposición de Cholesky del sistema 
simétrico siguiente: 


8 20 15|[x, 100 
20 80 50|73x,p = 3250 
15 50 60] |x, 100 


11.7 Calcule la descomposición de Cholesky de 


9.000 
[A]=|0 25 0 
0.0 4 


¿Su resultado tiene sentido en términos de las ecuaciones (11.3) y 
(11.4)? 


11.8 Use el método de Gauss-Seidel para resolver el sistema tridiago- 
nal del problema 11.1 (€,= 5%). Utilice sobrerrelajación conA = 1.2. 
11.9 Del problema 10.8, recuerde que el sistema de ecuaciones si- 
guiente está diseñado para determinar concentraciones (las c están 
en g/m?) en una serie de reactores acoplados como función de la 
cantidad de masa de entrada a cada uno de ellos (los lados derechos 
están en g/d), 


15c, -3c,-c,=3 800 
3c, + 18c,- 6c,=1 200 
Ac, - Cc, + 12c,=2 350 


Resuelva este problema con el método de Gauss-Seidel para €, = 5%. 
11.10 Repita el problema 11.9, pero use la iteración de Jacobi. 
11.11 Emplee el método de Gauss-Seidel para resolver el sistema 
siguiente hasta que el error relativo porcentual esté por debajo de €, 
=5%, 


10x, + 2x, — x3 =27 
3x, — Óx, + 2x3 =-61.5 
x +x,+ 5x3 =-21.5 


11.12 Utilice el método de Gauss-Seidel a) sin relajación y b) con 
relajación (Á = 0.95), para resolver el sistema siguiente para una 
tolerancia de € ,=5%. Si es necesario, reacomode las ecuaciones para 
lograr convergencia. 


—3x, + x, + 12x, =50 
6x,—x,-x3=3 
6x, + 9x,+ x3=40 


11.13 Use el método de Gauss-Seidel a) sin relajación y b) con re- 
lajación A =1.2), para resolver el sistema siguiente para una tole- 
rancia de €, = 5%. Si es necesario, reacomode las ecuaciones para 
lograr convergencia. 


2x, — Óx, — x7 =-38 
—3x, — Xx, + 7x7 =-34 
-8x, + x, - 2x3 = -20 


11.14 Vuelva a dibujar la figura 11.5 para el caso en que las pendien- 
tes de las ecuaciones son 1 y —1. ¿Cuál es el resultado de aplicar el 
método de Gauss-Seidel a un sistema como ése? 

11.15 De los tres conjuntos siguientes de ecuaciones lineales, iden- 
tifique aquel(los) que no podría resolver con el uso de un método 
iterativo tal como el de Gauss-Seidel. Demuestre que su solución no 
converge, utilizando cualquier número de iteraciones que sea nece- 
sario. Enuncie con claridad su criterio de convergencia (es decir, 
cómo se sabe que no está convergiendo). 


Conjunto uno Conjunto dos Conjunto tres 


8x+3y+z =12 X+y+5zZ=7 XA + 3y +52 =7 
—6x + 1zZ =1 x+4y-z=4 2x + Ay -5z =-3 
2x+4y-z=5 B3x+y-z=4 2y-z=1 


11.16 Emplee el paquete de software de su preferencia para obtener 
una solución, calcular la inversa y determinar el número de condición 
(sin dar escala) con base en la norma de suma de renglones, para los 
sistemas 
a) [1 4 9]|lÍx 14 
4 9 16 
9 16 25] [x, S0 
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br 11 4 9 16] fx 30 
4 9 16 25| |x, 54 
9 16 25 36||x,[| 186 


16 25 36 49| |x, 


En ambos casos, las respuestas para todas las x deben ser 1. 
11.17 Dado el par siguiente de ecuaciones simultáneas no lineales: 


fa, y) =4-y-2x 
2(x, y) =8-y?-4x 


a) Usela herramienta Solver de Excel para determinar los dos pares 
de valores de x y y que satisfacen estas ecuaciones. 

b) Con el empleo de un rango de valores iniciales (x=-6 a 6, y y 
= 6 a 6), determine cuáles valores iniciales producen cada una 
de las soluciones. 

11.18 Una compañía de electrónica produce transistores, resistores 
y chips de computadora. Cada transistor requiere cuatro unidades de 
cobre, una de zinc y dos de vidrio. Cada resistor requiere tres, tres y 
una unidades de dichos materiales, respectivamente, y cada chip de 
computadora requiere dos, una y tres unidades de los materiales, 
respectivamente. En forma de tabla, esta información queda así: 


Componente 


Cobre Zinc Vidrio 
Transistores 4 1 2 
Resistores 3 3 1 


Chips de computadora 2 1 3 


Los suministros de estos materiales varían de una semana a la otra, 
de modo que la compañía necesita determinar una corrida de produc- 
ción diferente cada semana. Por ejemplo, cierta semana las cantida- 
des disponibles de los materiales son 960 unidades de cobre, 510 
unidades de zinc y 610 unidades de vidrio. Configure el sistema de 
ecuaciones que modela la corrida de producción y use software Excel, 
MATLAB o Mathcad para despejar el número de transistores, resis- 
tores y chips de computadora que se deben fabricar esta semana. 
11.19 Utilice el software de MATLAB o Mathcad para determinar el 
número de condición espectral para una matriz de Hilbert de dimensión 
10. ¿Cuántos dígitos de precisión se espera que se pierdan debido al 
mal acondicionamiento? Determine la solución para este sistema para 
el caso en que cada elemento del vector del lado derecho ([b) consiste 
en la suma de los coeficientes de su renglón. En otras palabras, resuel- 
va para el caso en que todas las incógnitas deben ser exactamente uno. 
Compare los errores resultantes con aquellos esperados con base en 
el número de condición. 

11.20 Repita el problema 11.19, pero para el caso de una matriz de 
Vandermonde de seis dimensiones (véase el problema 10.17) donde 
x1=4,x=2,x=7,x,=10,x,=3 y x,=5. 

11.21 Dada una matriz cuadrada [A], escriba un comando MATLAB 
de un solo renglón que cree una nueva matriz [Aug] que consista en 
la matriz original [A] aumentada por una matriz de identidad [/]. 
11.22 Escriba el siguiente sistema de ecuaciones en forma matricial: 


50 = 5x3 — 7x2 
4x2 +7x3 +30=0 
x1 — 7x3 =40-—3x2+5x1 
Use software Excel, MATLAB o Mathcad para despejar las incógni- 


tas. Además, calcule la transposición y la inversa del matriz de co- 
eficientes. 
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11.23 En la sección 9.2.1 se determinó el número de operaciones 
que se requiere para la eliminación de Gauss sin pivoteo parcial. 
Efectúe una determinación similar para el algoritmo de Thomas 
(véase la figura 11.2). Desarrolle una gráfica de operaciones versus 
n (de 2 a 20) para ambas técnicas. 

11.24 Desarrolle un programa amigable para el usuario en cualquier 
lenguaje de alto nivel o de macros, de su elección, para obtener una 
solución para un sistema tridiagonal con el algoritmo de Thomas 
(figura 11.2). Pruebe su programa por medio de repetir los resultados 
del ejemplo 11.1. 

11.25 Desarrolle un programa amigable para el usuario en cualquier 
lenguaje de alto nivel o de macros, que elija, para hacer la descompo- 
sición de Cholesky con base en la figura 11.3. Pruebe su programa por 
medio de repetir los resultados del ejemplo 11.2. 

11.26 Desarrolle un programa amigable para el usuario en cualquier 
lenguaje de alto nivel o de macros, que escoja, a fin de ejecutar el 
método de Gauss-Seidel con base en la figura 11.6. Pruébelo con la 
repetición de los resultados del ejemplo 11.3. 

11.27 Como se describe en la sección PT3.1.2, pueden presentarse 
las ecuaciones algebraicas lineales en la solución de ecuaciones di- 
ferenciales. Por ejemplo, la siguiente ecuación diferencial es el re- 
sultado de un balance de masas de estado estable para un producto 
químico en un canal unidimensional: 


0=D=— — 
dx? dx 
donde c = concentración, f = tiempo, x = distancia, D = coeficiente 
de difusión, U = velocidad del fluido y k = tasa de decaimiento de 


Matrices especiales y el método de Gauss-Seidel 


primer orden. Convierta esta ecuación diferencial a un sistema equi- 
valente de ecuaciones algebraicas simultáneas. Dados D=2, U= 1, 
k= 0.2, c(0) = 80 y c(10) = 20, resuelva estas ecuaciones desde x = 
0 a 10, con Ax = 2 y desarrolle una gráfica de concentración contra 
distancia. 

11.28 Un sistema pentadiagonal con un ancho de banda de cinco se 
puede expresar generalmente como 


A 8 h Xx ri 

e A g h x2 72 

| d e f gh | x3 13 
| dn-1 egn—1 fm-1 al Xn-1 fn-1 

A €n fa Xn Fa 


d, 


Desarrolle un programa para resolver eficientemente tales sistemas 
sin estrategia de pivoteo, de manera similar al algoritmo que se usó 
para matrices tridiagonales en la sección 11.1.1. Pruébelo para el si- 
guiente caso: 


s —2 -—1 0 0 X1 


E E 
E E a 


ua 2 12 E] Xa 
0 0-7 -3 151 lx 


>= 

uy 

Il 
NrRonvu 


Estudio de casos: ecuaciones 
algebraicas lineales 


El propósito de este capítulo es usar los procedimientos numéricos analizados en los capítulos 9, 10 
y 11 para resolver sistemas de ecuaciones algebraicas lineales, en algunas aplicaciones a la ingenie- 
ría. Dichas técnicas numéricas sistemáticas tienen significado práctico, ya que los ingenieros con 
mucha frecuencia se enfrentan a problemas que involucran sistemas de ecuaciones que son dema- 
siado grandes para resolverse a mano. Los algoritmos numéricos en estas aplicaciones son particu- 
larmente adecuados para implementarse en computadoras personales. 

En la sección 12.1 se muestra cómo se emplea un balance de masa para modelar un sistema de 
reactores. En la sección 12.2 se le da especial énfasis al uso de la matriz inversa para determinar las 
complicadas interacciones causa-efecto entre las fuerzas en los elementos de una armadura. La 
sección 12.3 constituye un ejemplo del uso de las leyes de Kirchhoff para calcular las corrientes y 
voltajes en un circuito con resistores. Por último, la sección 12.4 es una ilustración de cómo se em- 
plean las ecuaciones lineales para determinar la configuración en estado estacionario de un sistema 
masa-resorte. 


12.1 ANÁLISIS EN ESTADO ESTACIONARIO DE UN SISTEMA 
DE REACTORES (INGENIERÍA QUÍMICA/BIOINGENIERÍA) 


Antecedentes Uno de los principios de organización más importantes en la ingeniería química 
es la conservación de la masa (recuerde la tabla 1.1). En términos cuantitativos, el principio se ex- 
presa como un balance de masa que toma en cuenta todas las fuentes y sumideros de un material 
que entra y sale de un volumen (figura 12.1). En un periodo finito, esto se expresa como 


Acumulación = entradas — salidas (12.1) 


El balance de masa representa un ejercicio de registro para la sustancia en particular que se 
modela. Para el periodo en que se calcula, si las entradas son mayores que las salidas, la masa de la 
sustancia dentro del volumen aumenta. Si las salidas son mayores que las entradas, la masa dismi- 
nuye. Si las entradas son iguales a las salidas, la acumulación es cero y la masa permanece constan- 
te. Para esta condición estable, o en estado estacionario, la ecuación (12.1) se expresa como 


Entradas = salidas (12.2) 


Emplee la conservación de la masa para determinar las concen- 
traciones en estado estacionario de un sistema de reactores conec- 
tados. 


Solución Se puede usar el balance de masa para resolver pro- 

blemas de ingeniería al expresar las entradas y salidas en términos Entrada 

de variables y parámetros medibles. Por ejemplo, si se realiza un 

balance de masa para una sustancia conservativa (es decir, aque- 

lla que no aumente ni disminuya debido a transformaciones quí- 

micas) en un reactor (figura 12.2), podríamos cuantificar la 

velocidad con la cual el flujo de la masa entra al reactor a través Figura 12.1 


Acumulación 


Volumen 


Salida 


de dos tuberías de entrada y sale de éste a través de una tubería de Una representación esquemática del balance de masa. 


salida. Esto se hace mediante el producto de la velocidad del flui- 


254 Capítulo 12 Estudio de casos: ecuaciones algebraicas lineales 


cy = 25 mg/m'* á 
— 
O, = 3.5 m*/min 
c=? 
5 
0, = 1.5 m*/min ED 
c, = 10 mg/m* 
o 
> 
Figura 12.2 


Un reactor en estado estacionario, completamente mez- 
clado, con dos tuberías de entrada y una de salida. Los 
caudales Q están en metros cúbicos por minuto, y las con- 
centraciones c están en miligramos por metro cúbico. 


do o caudal O (en metros cúbicos por minuto) por la concentración 
c (en miligramos por metro cúbico) en cada tubería. Por ejemplo, 
en la tubería 1 de la figura 12.2, Q, = 2 m*/min y c, = 25 mg/m?; 
por lo tanto, la velocidad con la cual la masa fluye hacia el reactor 
a través de la tubería 1 es Oc, = (2 m/mim(25 mg/m?) = 50 mg/ 
min. Así, 50 mg de sustancias químicas fluyen cada minuto hacia 
el interior del reactor a través de esta tubería. De forma similar, 
para la tubería 2 la velocidad de masa que entra se calcula como 
0,c, = (1.5 m*/min) (10 mg/m?) = 15 mg/min. 

Observe que la concentración a la salida del reactor a través 
de la tubería 3 no se especifica en la figura 12.2. Esto es así por- 
que ya se tiene información suficiente para calcularla con base en 
la conservación de la masa. Como el reactor se halla en estado 
estacionario se aplica la ecuación (12.2) y las entradas deberán 
estar en balance con las salidas, 


Q¡c¡ + Q,c, = Q3cz 
Sustituyendo los valores dados en esta ecuación se obtiene 
50 + 15 = 3.5c 


de la cual se despeja cz = 18.6 mg/m'. De esta forma, hemos determinado la concentración en la terce- 
ra tubería. Sin embargo, del cálculo se obtiene algo más. Como el reactor está bien mezclado (repre- 
sentado por el agitador en la figura 12.2), la concentración será uniforme, u homogénea, en todo el 
tanque. Por lo que la concentración en la tubería 3 deberá ser idéntica a la concentración en todo 
el reactor. En consecuencia, el balance de masa nos ha permitido calcular tanto la concentración en el 
reactor como en el tubo de salida. Esta información es de gran utilidad para los ingenieros químicos y 
petroleros, quienes tienen que diseñar reactores que tengan mezclas de una concentración específica. 

Debido a que se utilizó álgebra simple para determinar la concentración de un solo reactor en 
la figura 12.2, podría no ser obvio lo que tiene que hacer una computadora en el cálculo de un 
balance de masa. En la figura 12.3 se muestra un problema donde las computadoras no solamente 
son útiles, sino que son de una enorme necesidad práctica. Debido a que hay cinco reactores in- 
terconectados o acoplados, se necesitan cinco ecuaciones de balance de masa para caracterizar 
el sistema. En el reactor 1, la velocidad de la masa que entra es 


5(10) + O3103 
y la velocidad de la masa que sale es 


Q 1,01 + QisC; 


Do = 8 
Co = 20 


Figura 12.3 
Cinco reactores conectados por tuberías. 


Como el sistema se encuentra en estado estacionario, los flujos de 
entrada y de salida deben ser iguales: 


5(10) + Q3/c3 = Qy,01 + Qisc; 
o, sustituyendo los valores de la figura 12.3, 
6c; = (3 = 50 
Ecuaciones similares se obtienen para los otros reactores: 
3cC; + 3c, =0 
—Ca + 9cz = 160 
=C,- 803 + 11c,¿-2c5=0 
3c; =C2 + de; = 0 
Se puede utilizar un método numérico para resolver estas 


cinco ecuaciones con las cinco incógnitas que son las concen- 
traciones: 


(Cy"=L11.51 11.51 1906 17.00 11.51 


12.2 Análisis de una armadura estáticamente determinada (ingeniería civil/ambiental) 


Además, la matriz inversa se calcula como 


0.16981 0.00629 0.01887 0 0 
0.16981 0.33962 0.01887 0 0 
[4]! = | 0.01887 0.03774 0.11321 0 0 
0.06003 0.07461 0.08748 0.09091 0.04545 
0.16981 0.08962 0.01887 0 0.25000 


Cada uno de los elementos a; significa el cambio en la concentración del reactor ¿ debido a un cam- 
bio unitario en la carga del reactor j. De esta forma, los ceros en la columna 4 indican que una carga 
en el reactor 4 no influirá sobre los reactores 1, 2, 3 y 5. Esto es consistente con la configuración del 
sistema (figura 12.3), la cual indica que el flujo de salida del reactor 4 no alimenta ningún otro 
reactor. En cambio, las cargas en cualquiera de los tres primeros reactores afectarán al sistema 
completo, como se indica por la ausencia de ceros en las primeras tres columnas. Tal información 
es de gran utilidad para los ingenieros que diseñan y manejan sistemas como éste. 


12.2 ANÁLISIS DE UNA ARMADURA ESTÁTICAMENTE 
DETERMINADA (INGENIERÍA CIVIL/AMBIENTAL) 


Antecedentes Un problema importante en la ingeniería estructural es encontrar las fuerzas y 
reacciones asociadas con una armadura estáticamente determinada. En la figura 12,4 se muestra el 
ejemplo de una armadura. 

Las fuerzas (F") representan ya sea la tensión o la compresión sobre los componentes de la ar- 
madura. Las reacciones externas (H,, V, y V3) son fuerzas que caracterizan cómo interactúa dicha 
estructura con la superficie de soporte. El apoyo fijo en el nodo 2 puede transmitir fuerzas horizon- 
tales y verticales a la superficie, mientras que el apoyo móvil en el nodo 3 transmite sólo fuerzas 
verticales. Se observa que el efecto de la carga externa de 1 000 lb se distribuye entre los componen- 
tes de la armadura. 


Solución Este tipo de estructura se puede describir como un conjunto de ecuaciones algebraicas 
lineales acopladas. Los diagramas de fuerza de cuerpo libre para cada nodo se muestran en la figu- 
ra 12.5. La suma de las fuerzas en ambas direcciones, vertical y horizontal, deben ser cero en cada 
nodo, ya que el sistema está en reposo. Por lo tanto, para el nodo 1, 


2Fy=0=-F cos 307 + Fz cos 60% + F ,, (12.3) 

2Fy=0=-F' sen 30* — F; sen 60 +F , (12.4) 
para el nodo 2, 

EF, =0=F,+F, cos 30? + F) , + H) (12.5) 

2Fy=0=F, sen 30% + F) , + Va (12.6) 


para el nodo 3, 


YF y =0=-—F,-F,; Cos 60% + F3,, (12.7) HA, 
e 
EF,y=0=F; sen 60 + F; , + V; (12.8) 
donde FF; , es la fuerza horizontal externa aplicada sobre el nodo p 


i (se considera que una fuerza positiva va de izquierda a derecha) 
y Fi; es la fuerza vertical externa que se aplica sobre el nodo 
(donde una fuerza positiva va hacia arriba). Así, en este problema, Figura 12.4 


| 000 lb 
1 


255 


la fuerza de 1000 lb hacia abajo en el nodo ¡corresponde a F,, = Fuerzas en una armadura estáticamente determinada. 


—1000 libras. En este caso, todas las otras F;, y F;, son cero. 
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Figura 12.5 

Diagramas de fuerza de cuerpo libre para los 
nodos de una armadura estáticamente deter- 
minada. 


Observe que las direcciones de las fuerzas internas y de las reacciones son desconocidas. La aplica- 
ción correcta de las leyes de Newton requiere sólo de suposiciones consistentes respecto a la dirección. 
Las soluciones son negativas si las direcciones se asumen de manera incorrecta. También observe 
que en este problema, las fuerzas en todos los componentes se suponen en tensión y actúan tirando 
de los nodos adyacentes. Una solución negativa, por lo tanto, corresponde a compresión. Este pro- 
blema se plantea como el siguiente sistema de seis ecuaciones con seis incógnitas: 


0.866 0 05 o. 0.0 F, 0 

05 0 086 0 0 0 E 1000 

0866 1 0 1. 0.0 EL) o 

05 0.0 0 1 0 HI> Vw q) 
0 1 05 0. 0.0 v, 0 
0 O 086 0 0 v, 0 


Observe que, como se formuló en la ecuación (12.9), se requiere de pivoteo parcial para evitar 
la división entre cero de los elementos de la diagonal. Con el uso de una estrategia de pivote, el sis- 
tema se resuelve mediante cualquiera de las técnicas de eliminación que se analizaron en los capí- 
tulos 9 y 10. Sin embargo, como este problema es un caso de estudio ideal, para demostrar la utilidad 
de la matriz inversa se utiliza la descomposición LU para calcular 


F,=-500  F,=433  F,=-866 
H, = 0 v, = 250 V; = 750 


la matriz inversa es 


0.866 0.5 0.0 0. 0 

0.25 0.433 0.0 1.0 

[AJ= | -0,5 0.866 0 0 0 0 
1 0 -1 0 1 0 

0.433  -0.25 o -— 0.0 

0.433 0.75 0. 0 0-1 


Ahora, observe que el vector del lado derecho representa las fuerzas horizontales y verticales apli- 
cadas externamente sobre cada nodo, 


(Py=LFP,, Pio Fag Fay Fan F3,) (14:10) 


Debido a que las fuerzas externas no tienen efecto sobre la descomposición LU, no se necesita 
aplicar el método una y otra vez para estudiar el efecto de diferentes fuerzas externas sobre la arma- 
dura. Todo lo que hay que hacer es ejecutar los pasos de sustitución hacia adelante y hacia atrás, para 
cada vector del lado derecho, y así obtener de manera eficiente soluciones alternativas. Por ejemplo, 
podríamos querer estudiar el efecto de fuerzas horizontales inducidas por un viento que sopla de 


12.3 Corrientes y voltajes en circuitos con resistores (ingeniería eléctrica) 


1000 


Figura 12.6 
Dos casos de prueba que muestran a) vientos desde la izquierda y b) vientos desde la derecha. 


izquierda a derecha. Si la fuerza del viento se puede idealizar como dos fuerzas puntuales de 1000 
libras sobre los nodos 1 y 2 (figura 12.6a), el vector del lado derecho es 


(Fy"=1-1000 0 1000 0 0 Ol 

que se utiliza para calcular 
F, =866 F,=250 F,=-500 
H, =-2000 V, = 433 V, = 433 


Para un viento de la derecha (figura 12.6b), F; ,, = 1000, F; , =-1000, y todas las demás fuerzas 
externas son cero, con lo cual resulta 


F¡=-866  F,=-1250  F,=500 
H,=2000  V,=433 V, =-433 


Los resultados indican que los vientos tienen efectos marcadamente diferentes sobre la estructura. 
Ambos casos se presentan en la figura 12.6. 

Cada uno de los elementos de la matriz inversa tienen también utilidad directa para aclarar 
las interacciones estímulo-respuesta en la estructura. Cada elemento representa el cambio de una 
de las variables desconocidas a un cambio unitario de uno de los estímulos externos. Por ejemplo, 
el elemento az) indica que la tercera incógnita (F3) cambiará a 0.866 debido a un cambio unitario del 
segundo estímulo externo (F, ,). De esta forma, si la carga vertical en el primer nodo fuera aumen- 
tada en 1, Fz se podría aumentar en 0.866. El hecho de que los elementos sean O indica que ciertas 
incógnitas no se ven afectadas por algunos de los estímulos externos. Por ejemplo, a) =0 significa 
que F, no se ve afectado por cambios en F) ;,. Esta habilidad de aislar interacciones tiene diversas 
aplicaciones en la ingeniería; éstas comprenden la identificación de aquellos componentes que son 
más sensibles a estímulos externos y, como una consecuencia, más propensos a fallar. Además, esto 
sirve para determinar los componentes que son innecesarios (véase el problema 12.18). 

El procedimiento anterior resulta particularmente útil cuando se aplica a grandes estructuras 
complejas. En la práctica de la ingeniería, en ocasiones es necesario resolver armaduras con cientos 
y aun miles de elementos estructurales. Las ecuaciones lineales proporcionan un medio poderoso 
para ganar cierta comprensión del comportamiento de dichas estructuras. 


12.3 CORRIENTES Y VOLTAJES EN CIRCUITOS CON RESISTORES 
(INGENIERÍA ELÉCTRICA) 


Antecedentes Un problema común en ingeniería eléctrica es la determinación de corrientes y 
voltajes en algunos puntos de los circuitos con resistores. Tales problemas se resuelven utilizando 
las reglas para corrientes y voltajes de Kirchhoff. La regla para las corrientes (o nodos) establece 
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a) 
V 0d Y 
e al 
ly 
b) 
Figura 12.7 
Representaciones esque- 


máticas de a) la regla de 
las corrientes de Kirchhoff 
y b) la ley de Ohm. 
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que la suma algebraica de todas las corrientes que entran a un nodo debe ser cero (véase figura 12.7a), 
Y 


xi=0 (12.11) 


donde todas las corrientes que entran al nodo se consideran de signo positivo. La regla de las co- 
rrientes es una aplicación del principio de la conservación de la carga (recuerde la tabla 1.1). 

La regla para los voltajes (o ciclos) especifica que la suma algebraica de las diferencias de po- 
tencial (es decir, cambios de voltaje) en cualquier ciclo debe ser igual a cero. Para un circuito con 
resistores, esto se expresa como 


YE -—XiR=0 (12.12) 


donde é es la fem (fuerza electromotriz) de las fuentes de voltaje, y R es la resistencia de cualquier 
resistor en el ciclo. Observe que el segundo término se obtiene de la ley de Ohm (figura 12.7b), la 
cual establece que la caída de voltaje a través de un resistor ideal es igual al producto de la corrien- 
te por la resistencia. La regla de Kirchhoff para el voltaje es una expresión de la conservación de la 
energía. 


Solución La aplicación de estas reglas da como resultado un sistema de ecuaciones algebraicas 
lineales simultáneas, ya que los ciclos que forman un circuito están conectadas. Por ejemplo, consi- 
dere el circuito de la figura 12.8. Las corrientes asociadas con este circuito son desconocidas, tanto 
en magnitud como en dirección. Esto no presenta gran dificultad, ya que tan sólo se supone una 
dirección para cada corriente. Si la solución resultante a partir de las leyes de Kirchhoff es negativa, 
entonces la dirección supuesta fue incorrecta. Por ejemplo, la figura 12.9 muestra direcciones su- 
puestas para las corrientes. 


vW O Y, = 200 V AAA ANA O 
-—.- -— 
l 150) 
R=50= = R=100 Sh, a =4 le 
WO Vs = 0 Y WO 
R=150 R=200 
Figura 12.8 


Un circuito con resistores para resolverse usando ecuaciones 
algebraicas lineales simultáneas. 


V = 153.85 V= 


Figura 12.9 
Corrientes supuestas. 


Dadas estas suposiciones, la regla de la corriente de Kirchhoff 
se aplica a cada nodo para obtener 

ip+is+izo=0 

los — 5 — 154 =0 


169.23 lgg= bx =0 


O  V=200 


ls lg =0 


¿61538 La aplicación de la regla de voltajes en cada uno de los ciclos da 


—is¿Rs4— ls Raz — d32R 32 + l52R 52 =0 


V = 146.15 V= 


Figura 12.10 


E A EA 
123.08 6565 3252 1212 


o, sustituyendo el valor de las resistencias de la figura 12.8 y pa- 
sando las constantes al lado derecho, 


La solución obtenida para las corrientes y voltajes usando 
un método de eliminación. 


ia Si - is + 106 =0 
—2016s = 1015, + Sis = 200 


12.4 Sistemas masa-resorte (ingeniería mecánica/aeronáutica) 


Por lo tanto, el problema consiste en la solución del siguiente conjunto de seis ecuaciones con seis 
corrientes como incógnitas: 


1 1 1 0 o ol fi, 0 
O al 0 Lo1 0 ds 0 
0 A 0 0 1 A 
0 0 0 0 lí S 0 
0 10 -10 br le as 0 

5 10 o 20 o 0) lía 200 


Aunque no es práctico resolverlo a mano, este sistema se resuelve de manera sencilla con un método 
de eliminación. Si se procede de esta forma, la solución es 


ip = 6.1538 is =-4.6154 ij =-1.5385 
lós = 6.1538 ls4 = -1.5385 laz = -1.5385 


Así, con una interpretación adecuada de los signos del resultado, las corrientes y voltajes en el cir- 
cuito se muestran en la figura 12.10. Deben ser evidentes las ventajas de usar algoritmos numéricos 
y computadoras para problemas de este tipo. 


12.4 SISTEMAS MASA-RESORTE (INGENIERÍA 
MECÁNICA/AERONÁUTICA) 


Antecedentes Los sistemas idealizados masa-resorte desempeñan un papel importante en la 
mecánica y en otros problemas de ingeniería. En la figura 12.11 se presenta un sistema de este tipo. 
Después de liberar las masas, éstas son jaladas hacia abajo por la fuerza de gravedad. Observe que 
el desplazamiento resultante en cada resorte de la figura 12.115 se mide a lo largo de las coordenadas 
locales referidas a su posición inicial en la figura 12.11a. 

Como se mencionó en el capítulo 1, la segunda ley de Newton 
se emplea en conjunto con el equilibrio de fuerzas para desarrollar 
un modelo matemático del sistema. Para cada masa, la segunda 


ley se expresa como 3 k 


dx m; ALL 


ma =P =K, (12.13) 


Para simplificar el análisis se supondrá que todos los resortes son 
idénticos y que se comportan de acuerdo con la ley de Hooke. En 


la figura 12.12a se muestra un diagrama de cuerpo libre para la 


primera masa. La fuerza hacia arriba es únicamente una expresión mM a 
directa de la ley de Hooke: 
Fy=Kkx (12.14) my 
Las componentes hacia abajo consisten en las dos fuerzas del 
resorte junto con la acción de la gravedad sobre la masa, a) b) 
Fp= k(x2—x1) + k(%, —X1) =M18 (12.15) 


Observe cómo la componente de fuerza de los dos resortes es Figura 12.81 


proporcional al desplazamiento de la segunda masa, x,, corregida 
por el desplazamiento de la primera masa, x;. 
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3 


Un sistema compuesto de tres masas suspendidas vertical- 
mente por una serie de resortes. a) El sistema antes de ser 
liberado, es decir, antes de la extensión o compresión de 


Las ecuaciones (12.14) y (12.15) se sustituyen en la ecuación — los resortes. b) El sistema después de ser liberado. Observe 
(12.13) para dar que las posiciones de las masas están en referencia a las 


Px 


7 =2k(x, -x,)+m,8 kx, (12.16) Ser liberadas. 


mi; 


coordenadas locales con orígenes en su posición antes de 
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kx; K(% — X1) kx) — x1) K(%3 — x)) 


my m> m 
Kk(c, = x1) m8 k(x, — x,) mM>8 Kk(z — Xx,) mM38 
a) b) c) 


Figura 12.12 
Diagramas de cuerpo libre para las tres masas de la figura 12.11. 


De esta forma, se ha obtenido una ecuación diferencial ordinaria de segundo orden para describir el 
desplazamiento de la primera masa con respecto al tiempo. Sin embargo, advierta que la solución 
no se puede obtener, ya que el modelo tiene una segunda variable dependiente, x,. En consecuencia, 
se deben desarrollar diagramas de cuerpo libre para la segunda y tercera masas (figuras 12.12b y c) 
que se emplean para obtener 


dx 
m, 7 = k(x, —x,)+m,8 — 2k(x, — x,) (12.17) 
yA 
d? 
m, > =M38 — k(x3 — X,) (12.18) 


Las ecuaciones (12.16), (12.17) y (12.18) forman un sistema de tres ecuaciones diferenciales con 
tres incógnitas. Con las condiciones iniciales apropiadas, estas ecuaciones sirven para calcular los 
desplazamientos de las masas como una función del tiempo (es decir, sus oscilaciones). En la parte 
siete estudiaremos los métodos numéricos para obtener tales soluciones. Por ahora, podemos obtener 
los desplazamientos que ocurren cuando el sistema eventualmente llega al reposo, es decir, al estado 
estacionario. Para esto se igualan a cero las derivadas en las ecuaciones (12.16), (12.17) y (12.18), 
obteniéndose 


3kxy —  2kx» = Mg 
—2Kkx; + 3kx) = Kkx3 = m8 
- kx + Kkxz3 = M3 
o, en forma matricial, 
[KI(X) = (W) 
donde [K], conocida como matriz de rigidez, es 
3k  -2k 
[K]= |-—2k 3Bk  —k 


y [X] y [W) son los vectores columna de las incógnitas X y de los pesos mg, respectivamente. 


Solución Aquí se emplean métodos numéricos para obtener una solución. Sim, =2 kg, m,=3 kg, 
my =2.5 kg, y todas las k = 10 kg/s?, use la descomposición LU con el propósito de obtener los des- 
plazamientos y generar la inversa de [K]. 


Problemas 


Sustituyendo los parámetros del modelo con g = 9.81 se obtiene 


30 -—20 19.62 
[K] = | 20 30 -10 [W) = 4 29.43 
10 10 24.525 


La descomposición LU se utiliza con el objetivo de obtener x, = 7.36, x, = 10.06 y x3 = 12.51. Estos 
desplazamientos se utilizaron para construir la figura 12.11b. La inversa de la matriz de rigidez 
calculada es 


01. 01 01 
[K]J3=|(01 0.15 0.15 
0.1. 015 0.25 


Cada elemento de la matriz k;;' nos indica el desplazamiento de la masa ¡ debido a una fuerza 
unitaria impuesta sobre la masa j. Así, los valores 0.1 en la columna 1 nos indican que una carga uni- 
taria hacia abajo en la primera masa desplazará todas las masas 0.1 m hacia abajo. Los otros elementos 
se interpretan en forma similar. Por lo tanto, la inversa de la matriz de rigidez proporciona una síntesis 
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de cómo los componentes del sistema responden a fuerzas que se aplican en forma externa. 


PROBLEMAS 


Ingeniería química/bioingeniería 

12.1 Lleve a cabo el mismo cálculo que en la sección 12.1, pero 
cambie Cy, a20 y c¿3 a 6. También cambie los flujos siguientes: Op; 
=6,01,=4, 04 =2 y O = 12. 

12.2 Si la entrada al reactor 3 de la sección 12.1 disminuye 25%, 
utilice la matriz inversa para calcular el cambio porcentual en la 
concentración de los reactores 2 y 4. 

12.3 Debido a que el sistema que se muestra en la figura 12.3 está 
en estado estacionario (estable), ¿qué se puede afirmar respecto de 
los cuatro flujos: Qo1, Qoz, Qaa y Oss5? 

12.4 Vuelva a calcular las concentraciones para los cinco reacto- 
res que se muestran en la figura 12.3, si los flujos cambian como 
sigue: 


12.5 Resuelva el mismo sistema que se especifica en el problema 
12.4, pero haga O, = Os4=0 y Os = O34= 3. Suponga que las en- 
tradas (Op, Oo) y las salidas (Oy, Oss) son las mismas. Use la 
conservación del flujo para volver a calcular los valores de los demás 
flujos. 

12.6 En la figura P12.6 se muestran tres reactores conectados por 
tubos. Como se indica, la tasa de transferencia de productos quí- 
micos a través de cada tubo es igual a la tasa de flujo (O, en unidades 
de metros cúbicos por segundo) multiplicada por la concentración 
del reactor desde el que se origina el flujo (c, en unidades de mili- 
gramos por metro cúbico). Si el sistema se encuentra en estado es- 
tacionario (estable), la transferencia de entrada a cada reactor 
balanceará la de salida. Desarrolle las ecuaciones del balance de masa 
para los reactores y resuelva las tres ecuaciones algebraicas lineales 


Do =5 03, =3 0,,=2 0 =2 simultáneas para sus concentraciones. 
Did Da ds Da=d 12.7 Con el empleo del mismo enfoque que en la sección 12.1, de- 
ie BN di di termine la concentración de cloruro en cada uno de los Grandes 
Qi =4 Qo3 = 8 0, =0 O4,=10 Lagos con el uso de la información que se muestra en la figura P12.7. 
400 mg/s Q1c; Q3ac3 
—- —- — _ > 
1 3 
+ — o — 
oa |* | 200 mg/s 
Figura P12.6 Lata Qe 
Tres reactores unidos por tubos. La =>" / + 
tasa de transferencia de masa a través a 2 Oz, = 120 
de cada tubo es igual al producto de 01 z pa 
flujo Q y la concentración c del reactor ES a 60 
2 


desde el que se origina el flujo. 


0, = 20 
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12.8 La parte baja del río Colorado consiste en una serie de cuatro 
almacenamientos como se ilustra en la figura P12.8. Pueden escri- 
birse los balances de masa para cada uno de ellos, lo que da por re- 
sultado el conjunto siguiente de ecuaciones algebraicas lineales 
simultáneas: 


13.422 0 0 0 C; 750.5 
-13.422 12.252 0 0 C, 300 
0 -12.252 12.377 0 C, 3 102 
0 0 -12.377 11.797 | [c, 30 


donde el vector del lado derecho consiste en las cargas de cloruro 
hacia cada uno de los cuatro lagos y c,, C,, Cz y C4«= las concentracio- 
nes de cloruro resultantes en los lagos Powell, Mead, Mohave y 
Havasu, respectivamente. 

a) Use la matriz inversa para resolver cuáles son las concentraciones 
en cada uno de los cuatro lagos. 

b) ¿En cuánto debe reducirse la carga del lago Powell para que la 
concentración de cloruro en el lago Havasu sea de 75? 

c) Con el uso de la norma columna-suma, calcule el número de 
condición y diga cuántos dígitos sospechosos se generarían al 
resolver este sistema. 

12.9 Enla figura P12.9 se ilustra un proceso de extracción en etapas. 

En tales sistemas, una corriente que contiene una fracción de peso 

Y, de un producto químico ingresa por la izquierda con una tasa de 


*—— Flujo = F, 


Ontario 
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Os = 67 

Own = 36 
Oug = 161 
Oro = 182 
Qoo = 212 


4720 


Figura P12.7 

Balance del cloro en los Grandes La- 
gos. Las flechas numeradas denotan 
entradas directas. 


Alto 
río 
Colorado 


Lago 
Powell 
A 
Lago 
Mohave 
Lago 
Havasu 
Figura P12.8 


Caída del río Colorado. 


flujo de masa de F',. En forma simultánea, un solvente que lleva una 
fracción de peso X.,, del mismo producto químico entra por la dere- 
cha con una tasa de flujo de F,. Así, para la etapa i, el balance de 
masa se representa como 


*sal X *3 Xx; Xi+1 *n-1 7 Xent 
Geek. -<ek.. 
1 2 ... i ... n= 1 n 
ollo Jo > el — 
Yent Y1 Y sd Yi Va=2 asi Ysal 


Figura P12.9 
Una etapa del proceso de extracción. 


Flujo = F, =p 


FX + PX, = FF ¡Y + FAX, (P12.9.1) 


En cada etapa, se supone que se establece el equilibrio entre Y, y X,, 
como en 


K= (P12.9.2) 


ES 


donde K se denomina coeficiente de distribución. La ecuación (P12.9.2) 
puede resolverse para X, y se sustituye en la ecuación (P12.9.1) para 
producir 


y, £x 1+ [Ex |r,,=0 
E E 


Si F, = 400 kg/h, Yon = 0.1, F, = 800 kg/h, X¿, = 0 y K= 5, determi- 
ne los valores de Y,.¡ y X;,¡, si se emplea un reactor de cinco etapas. 
Obsérvese que debe modificarse la ecuación (P12.9.3) para tomar en 
cuenta las fracciones de peso del flujo de entrada cuando se aplique 
a la primera y última etapas. 

12.10 Una reacción de primer orden, irreversible, tiene lugar en 
cuatro reactores bien mezclados (véase la figura P12.10), 


(P12.9.3) 


A5B 
Así, la tasa a la cual A se transforma en B se representa por 
Rar =kVc 


Los reactores tienen volúmenes diferentes, y debido a que se operan 
a temperaturas diferentes, cada uno tiene distinta tasa de reacción: 


v L 


Reactor 


k, h1 
1 25 0.05 
2 75 0.1 
3 100 0.5 
4 25 0.1 


Determine la concentración de A y B en cada uno de los reactores en 
estado estable. 


Oz, =5 


Q43 =3 


Oónt = 10 


Cajent = 1 


Figura P12.10 


12.11 Una bomba peristáltica envía un flujo unitario (Q,) de un 
fluido muy viscoso. En la figura P12.11 se ilustra la red. Cada sección 
de tubo tiene la misma longitud y diámetro. El balance de masa y 
energía mecánica se simplifica para obtener los flujos en cada tubo. 
Resuelva el sistema de ecuaciones siguiente a fin de obtener el flujo 
en cada tubo. 


Q;+20,-20,=0 
05+20,-20,=0 
30,-205=0 
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4 Q 0, 9, 


Figura P12.11 


0, =0,+ 0; 
3=04+ Qs 
0;=05+ O; 


12.12 La figura P12.12 ilustra un proceso de intercambio químico 
que consiste en una serie de reactores en los que un gas que fluye de 
izquierda a derecha pasa por un líquido que fluye de derecha a iz- 
quierda. La transferencia de un producto químico del gas al líquido 
ocurre a una tasa proporcional a la diferencia entre las concentracio- 
nes del gas y el líquido en cada reactor. En estado estacionario (es- 
table), el balance de masa para el primer reactor se puede escribir 
para el gas, así 


Q6Cgo =QaCa + D(C;; =Cg1)=0 
y para el líquido, 

Q¡€12 70,11 + Dlc¿, =C,,)=0 
donde O¿ y O, son las tasas de flujo del gas y el líquido, respectiva- 
mente, y D = tasa de intercambio gas-líquido. Es posible escribir 
otros balances similares para los demás reactores. Resuelva para las 
concentraciones con los siguientes valores dados: O¿=2, O, = 1, 
D=0.8, Cc = 100, c,s = 20. 


06 ¡Ye 
Coco mo Cai a CG =p CG3 a Cga4 => Cas > 


Figura P12.12 


Ingeniería civil/ambiental 

12.13 Un ingeniero civil que trabaja en la construcción requiere 
4800, 5800 y 5690 m! de arena, grava fina y grava gruesa, respec- 
tivamente, para cierto proyecto constructivo. Hay tres canteras de las 
que puede obtenerse dichos materiales. La composición de dichas 
canteras es la que sigue 


Grava fina 


Arena Grava gruesa 
% % % 
Cantera 1 52 30 18 
Cantera 2 20 50 30 
Cantera 3 25 20 55 


¿Cuántos metros cúbicos deben extraerse de cada cantera a fin de 
satisfacer las necesidades del ingeniero? 
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12.14 Ejecute el mismo cálculo que en la sección 12.2, pero para la 
armadura que se ilustra en la figura P12.14. 


600 


Figura P12.14 


12.15 Realice el mismo cálculo que en la sección 12.2, pero para la 
armadura que se muestra en la figura P12,15. 


400 200 


Figura P12.15 


12.16 Calcule las fuerzas y reacciones para la viga de la figura 12.4, 
si en el nodo 1 se aplica una fuerza hacia abajo de 2500 kg y otra 
horizontal hacia la derecha de 2000 kg. 

12.17 En el ejemplo de la figura 12.4, donde en el nodo 1 se aplica 
una fuerza debajo de 1 000 libras, se calcularon las reacciones exter- 
nas V, y V3. Pero si se hubieran dado las longitudes de los miembros 
de las armaduras habría podido calcularse V, y Vz haciendo uso del 
hecho de que V, + V, debe ser igual a 1000, y con la suma de mo- 
mentos alrededor del nodo 2. Sin embargo, debido a que se conocen 
V, y V3, es posible trabajar a la inversa para resolver cuáles son las 


O. = 150 m'/h Q,= 100 m/h 


25 m'/h 
pi EA 
(Sección de niños) 


O, = 50 m'/h 


———_ A 2 


cy = 2 mg/m* 


O, = 200 m'/h 


—— 


Ñ 25 m*/h . 
c, = 2 mg/m? (Secció e í 3 

ección de fumar 
Carga por 


fumadores 
(1000 mg/h) 


Carga por la parrilla 
(2 000 mg/h) 
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longitudes de los miembros de la armadura. Obsérvese que debido 
a que hay tres longitudes desconocidas y sólo dos ecuaciones, se 
puede resolver sólo para la relación entre las longitudes. Resuelva 
para esta relación. 

12.18 Con el mismo método que se usó para analizar la figura 12.4, 
determine las fuerzas y reacciones para la armadura que se ilustra en 
la figura P12.18. 


800 


250 


Figura P12.18 


12,19 Resuelva para las fuerzas y reacciones para la armadura que 
se ilustra en la figura P12.19. Determine la matriz inversa para el 
sistema. ¿Parece razonable la fuerza del miembro vertical en el miem- 
bro de en medio? ¿Por qué? 


3 500 


Figura P12.19 


12.20 Como su nombre lo dice, la contaminación del aire interior se 
refiere a la contaminación del aire en espacios cerrados, como casas, 
oficinas, áreas de trabajo, etc. Suponga que usted está diseñando el 
sistema de ventilación para un restaurante como se ilustra en la 
figura P12.20. El área de servicio del restaurante consiste en dos 
habitaciones cuadradas y otra alargada. La habitación 1 y la 3 tienen 
fuentes de monóxido de carbono que proviene de los fumadores y 
de una parrilla defectuosa, respectivamente. Es posible plantear los 
balances de masa en estado estacionario para cada habitación. Por 
ejemplo, para la sección de fumadores (habitación 1), el balance es 
el siguiente 


Figura P12.20 

Vista de arriba de las áreas en un restaurante. Las flechas en un 
solo sentido representan flujos volumétricos de aire, mientras 
que las de dos sentidos indican mezclas difusivas. Las cargas 
debidas a los fumadores y a la parrilla agregan masa de mo- 
nóxido de carbono al sistema pero con un flujo de aire despre- 
ciable. 


0= Winmador E 


Q,Ca => Q.c: 


(carga) + (entrada) — (salida) + (mezcla) 


+ Ej(c3-C1) 


o al sustituir los parámetros 
225c, - 25c3 = 2 400 


Para las demás habitaciones se pueden escribir balances similares. 

a) Resuelva para la concentración de monóxido de carbono en 
estado estacionario en cada habitación. 

b) Determine qué porcentaje del monóxido de carbono en la sección 
de niños se debe a ¿) los fumadores, ¿i) la parrilla y ¡ii) el aire 
que entra por ventilación. 

c) Si las cargas de los fumadores y la parrilla se incrementan a 
2 000 y 5 000 mg/h, respectivamente, utilice la matriz inversa 
para determinar el aumento en la concentración en la sección 
de niños. 

d) ¿Cómo cambia la concentración en el área de niños si se cons- 
truye una pantalla de modo que la mezcla entre las áreas 2 y 4 
disminuya a 5 m*/h? 

12.21 Se aplica una fuerza hacia arriba de 20 kN en la cúspide de un 
trípode como se ilustra en la figura P12.21. Determine las fuerzas en 
las patas del trípode. 


Figura 12.21 


12.22 Se carga una armadura según se ilustra en la figura P12.22. 
Con el uso del conjunto siguiente de ecuaciones, resuelva para las 10 
incógnitas: AB, BC, AD, BD, CD, DE, CE, A, A, y E,. 

A, +AD=0 

A, HAB=0 

74 + BC + (3/5)BD=0 


24 - CD-(4/5)CE=0 
-AD + DE - (3/5)BD =0 
CD + (4/5)BD=0 


265 


Problemas 


54 kN 


Figura P12.22 


—AB-(4/5)BD=0 
-BC+(3/5)CE=0 


- DE-(3/5)CE=0 
E, + (4/5)CE=0 


Ingeniería eléctrica 
12.23 Efectúe el mismo cálculo que en la sección 12.3, pero para el 
circuito que se ilustra en la figura P12.23. 


R=100 


NW 


R=200 


WW 


O V, = 200 voltios 


O V¿ = 0 voltios 
6 


Figura P12.23 


12.24 Realice el mismo cálculo que en la sección 12.3, pero para el 
circuito que se muestra en la figura P12.24. 


R=300 


R=350 


WW 


O V, = 10 voltios 


O V, = 200 voltios 
6 


Figura P12.24 


12.25 Resuelva el circuito que aparece en la figura P12.25, para las 
corrientes en cada conductor. Utilice la eliminación de Gauss con 
pivoteo. 

12.26 Un ingeniero eléctrico supervisa la producción de tres tipos de 
componentes eléctricos. Para ello se requieren tres clases de material: 
metal, plástico y caucho. A continuación se presentan las cantidades 
necesarias para producir cada componente. 
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4 50 7 


200 60 0 
2 WWW WWW 8 
5 
10 
v, = 110 Vv, = 40 
Figura P12.25 
Metal, Plástico, Caucho 
Componente  g/componente  g/componente  g/componente 
1 15 0.30 1.0 
2 17 0.40 1.2 
3 19 0.55 ES 


Si cada día se dispone de un total de 3.88, 0.095 y 0.282 kg de metal, 

plástico y caucho, respectivamente, ¿cuántos componentes pueden 

producirse por día? 

12.27 Determine las corrientes para el circuito de la figura P12.27. 
50 


100 200 


Figura P12.27 


12.28 Calcule las corrientes en el circuito que aparece en la fi- 
gura P12.28. 


Figura P12.28 
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12.29 El sistema de ecuaciones que sigue se generó por medio de 
aplicar la ley de malla de corrientes al circuito de la figura P12.29: 


551, — 251, =-200 
-371, — 41, =-250 
-251, - 41, + 291, = 100 


Encuentre /;, [ze L,. 


100 10A 
——W O 


Figura P12.29 


12.30 El sistema de ecuaciones siguiente se generó con la aplicación 
de la ley de malla de corrientes al circuito de la figura P12,30: 


601, — 401, = 200 
-A01, + 1501, — 1001, =0 
-1001, + 1301, = 230 


Encuentre /;, 1, e L5. 


200 100 80 V 
W_—W——0) 


Figura P12.30 


Ingeniería mecánica/aeroespacial 

12.31 Lleve a cabo el mismo cálculo que en la sección 12.4, pero 
agregue un tercer resorte entre las masas 1 y 2, y triplique el valor de 
k para todos los resortes. 

12.32 Realice el mismo cálculo que en la sección 12.4, pero cambie 
las masas de 2, 3 y 2.5 kg por otras de 10, 3.5 y 2 kg, respectivamente. 
12.33 Los sistemas idealizados de masa-resorte tienen aplicaciones 
numerosas en la ingeniería. La figura P12.33 muestra un arreglo de 
cuatro resortes en serie comprimidos por una fuerza de 2000 kg. En 
el equilibrio, es posible desarrollar ecuaciones de balance de fuerza 
si se definen las relaciones entre los resortes. 


Ka 1) = Kyx 

Ks(x3 — x2) = Ka — x1) 

Kg(x4 — x3) = Ka — x,) 
F= ky(%4— X3) 


donde las k son constantes de los resortes. Si de k; a k, son 150, 50, 
75 y 225 N/m, respectivamente, calcule el valor de las x. 


xd F 
7 td 

3 
A 

Ss 
tl 

ar 
0 tl 

Ss 
0 


Figura P12.33 


12.34 Se conectan tres bloques por medio de cuerdas carentes de 
peso y se dejan en reposo en un plano inclinado (véase la figura 
P12.34a). Con el empleo de un procedimiento similar al que se usó 
en el análisis del paracaidista en descenso del ejemplo 9.11 se llega 
al conjunto siguiente de ecuaciones simultáneas (en la figura P12.34b 
se muestran los diagramas de cuerpo libre): 


100a4+T  =519.72 
50a - T+R= 216.55 
254 —R= 108.28 


100 x 9.8 =980 50 Xx 9.8 = 490 
b) 


25 X 9.8 = 245 


Figura P12.34 
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Resuelva para la aceleración a y las tensiones T y R en las dos cuer- 
das. 

12.35 Efectúe un cálculo similar al que se utilizó en el problema 
P12.34, pero para el sistema que se ilustra en la figura P12.35. 


A 
2 = 0.5 


Fricción = 0.3 


Fricción = 0.2 60 


pe 
30” 
Figura P12.35 


12.36 Realice el mismo cálculo que en el problema 12.34, pero para 
el sistema que se muestra en la figura P12.36 (los ángulos son de 
459). 


Fricción 
= 0.2 
Fricción = 0.8 


Figura P12.36 


12.37 Considere el sistema de tres masas y cuatro resortes que apa- 
rece en la figura P12.37. Al determinar las ecuaciones de movimien- 
to a partir de Y,F, = ma, para cada masa con el empleo de su 
diagrama de cuerpo libre, se llega a las ecuaciones diferenciales si- 
guientes: 


pa Xp pa X> 
k ko ka Ka 


Y Mm PNV Mm PNNV ms 
OLI TT TIT, z 7 


Figura P12.37 
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donde k¡ = k4= 10 N/m, k, = kz = 30 N/m y m;, = m, = my = 2 kg. 
Escriba las tres ecuaciones en forma matricial: 


0 = [vector de aceleración] + [matriz k/m] [vector de 
desplazamiento x] 


En un momento específico en el que x, = 0.05 m, x, = 0.04 m y x= 
0.03 m, se forma una matriz tridiagonal. Resuelva cuál es la acelera- 
ción de cada masa. 

12.38 Las ecuaciones algebraicas lineales pueden surgir al resolver 
ecuaciones diferenciales. Por ejemplo, la ecuación diferencial si- 
guiente proviene de un balance de calor para una barra larga y del- 
gada (véase la figura P12.38): 


2 

ET (r,-T)=0 (P12.38.1) 
dx 

donde T = temperatura (*C), x = distancia a lo largo de la barra (m), 
h' = coeficiente de transferencia de calor entre la barra y el aire del 
ambiente (m7?) y T, = temperatura del aire circundante (*C). Esta 
ecuación se transforma en un conjunto de ecuaciones algebraicas 
lineales por medio del uso de una aproximación en diferencias finitas 
divididas para la segunda derivada (recuerde la sección 4.1.3), 


Pr TDT, 


+1 


dx? Ax? 


donde 7; denota la temperatura en el nodo ¡. Esta aproximación se 
sustituye en la ecuación (P12.38.1) y se obtiene 


—T,+Q+ IA), -T,, = ht Ax T, 

Se puede plantear esta ecuación para cada uno de los nodos interiores 
de la barra, lo que resulta en un sistema tridiagonal de ecuaciones. 
Los nodos primero y último en los extremos de la barra están fijos 
por las condiciones de frontera. 

a) Desarrolle la solución analítica para la ecuación (P12.38.1) para 
una barra de 10 m con 7, = 20, T(x= 0) = 40, T(x = 10) =200 y 
h' =0.02. 

b) Desarrolle una solución numérica para los mismos valores de los 
parámetros que se emplearon en el inciso a), con el uso de una 
solución en diferencias finitas con cuatro nodos interiores según 
se muestra en la figura P12.38 (Ax=2 m). 


T.=200 


Figura P12.38 

Una barra uniforme sin aislamiento colocada entre dos paredes 
de temperatura constante pero diferente. La representación en 
diferencias finitas emplea cuatro nodos interiores. 


12.39 La distribución de temperatura de estado estable en una placa 
caliente está modelada por la ecuación de Laplace: 
_0 Td 


ds 
dx? dy 
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Si se representa la placa por una serie de nodos (véase la figura 
P12.39), las diferencias finitas divididas se pueden sustituir por las 
segundas derivadas, lo que da como resultado un sistema de ecua- 
ciones algebraicas lineales. Utilice el método de Gauss-Seidel para 
resolver cuáles son las temperaturas de los nodos que se aprecian en 
la figura P12.39. 


25 


25C 


Figura P12.39 


12.40 Una barra sobre una bola y una junta tipo socket está sujeta a 

los cables A y B como se observa en la figura P12.40. 

a) Si se ejerce una fuerza de 50 N sobre la barra sin masa en G, 
¿cuál es la fuerza de la tensión en los cables A y B? 

b) Resuelva cuáles son las fuerzas de reacción en la base de la 
barra. Denomine al punto de la base como P. 


Ze 


Bola y socket 


1 


Figura P12.40 
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PT3.4 ALTERNATIVAS 


La tabla PT3.2 ofrece un resumen de las ventajas y desventajas en la solución de ecuaciones alge- 
braicas lineales simultáneas. Dos métodos (el gráfico y la regla de Cramer) están limitados a pocas 
ecuaciones (<= 3), de modo que tienen escasa utilidad para resolver problemas prácticos. Sin embar- 
go, dichas técnicas son herramientas didácticas útiles para entender el comportamiento de los siste- 
mas lineales en general. 

Los métodos numéricos se dividen en dos categorías generales: métodos exactos y aproximados. 
Los primeros, como su nombre lo indica, buscan dar resultados exactos. No obstante, como están 
afectados por errores de redondeo, algunas veces dan resultados imprecisos. La magnitud del error 
de redondeo varía en cada sistema y depende de varios factores, como las dimensiones del sistema, 
su condición y el hecho de si la matriz de coeficientes es dispersa o densa. Además, la precisión de 
la computadora afectará el error de redondeo. 

Se recomienda una estrategia de pivoteo en todo programa de computadora que realice métodos 
de eliminación exactos. Esa estrategia minimiza el error de redondeo y evita problemas como el de 
la división entre cero. Los algoritmos basados en la descomposición LU son los métodos que se 
eligen debido a su eficiencia y flexibilidad. 


Tabla PT3.2 Comparación de las características de diversos métodos alternativos para 
encontrar soluciones de ecuaciones algebraicas lineales simultáneas. 


Rango de Complejidad de 


Método Estabilidad Precisión aplicación programación Comentarios 
Gráfico = Pobre Limitado = Puede tomar más tiempo 
que el método numérico 
pero puede ser útil para 
visualización 
Regla de Cramer = Afectada por errores Limitado = Excesiva complejidad 
de redondeo de cálculo 
para más de tres 
ecuaciones 
Eliminación de Gauss — Afectada por errores General Moderada 
(con pivoteo parcial) de redondeo 
Descomposición LU = Afectada por errores General Moderada Método de eliminación 
de redondeo preferido; permite el 
cálculo de la matriz 
inversa 
Gauss-Seidel Puede no Excelente Apropiada Fácil 
converger sólo para 
si no es sistemas 
diagonalmente diagonalmente 
dominante dominantes 


Aunque los métodos de eliminación tienen gran utilidad, el uso de toda la matriz de los coefi- 
cientes puede ser limitante cuando se trate con sistemas dispersos muy grandes. Esto se debe a que 
gran parte de la memoria de la computadora se dedicaría a guardar ceros que no tienen significado. 
Para sistemas a bandas, hay técnicas para realizar métodos de eliminación sin tener que guardar 
todos los coeficientes de la matriz. 

La técnica aproximada descrita en este libro se conoce como método de Gauss-Seidel, el cual 
difiere de las técnicas exactas porque emplea un esquema iterativo para obtener, progresivamente, 
estimaciones más cercanas a la solución. El efecto del error de redondeo es un punto discutible en 
el método de Gauss-Seidel, ya que se pueden continuar las iteraciones hasta que se obtenga la pre- 
cisión deseada. Además, se pueden desarrollar versiones del método de Gauss-Seidel para utilizar 
de manera eficiente los requerimientos de almacenaje en computadora con sistemas dispersos. En 
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consecuencia, la técnica de Gauss-Seidel es útil para grandes sistemas de ecuaciones, donde los 
requerimientos de almacenaje podrían llevar a problemas significativos con las técnicas exactas. 

La desventaja del método de Gauss-Seidel es que no siempre converge o algunas veces conver- 
ge de manera lenta a la solución verdadera. Es confiable sólo para aquellos sistemas que son diago- 
nalmente dominantes. Sin embargo, hay métodos de relajación que algunas veces contrarrestan 
tales desventajas. Además, como muchos sistemas de ecuaciones algebraicas lineales surgen de 
sistemas físicos que presentan dominancia diagonal, el método de Gauss-Seidel tiene gran utilidad 
para resolver problemas de ingeniería. 

En resumen, varios factores serán relevantes en la elección de una técnica para un problema en 
particular que involucre ecuaciones algebraicas lineales. No obstante, como se mencionó antes, el 
tamaño y la densidad del sistema son factores particularmente importantes en la determinación de 
su elección. 


PT3.5 RELACIONES Y FÓRMULAS IMPORTANTES 


Cada una de las partes de este libro incluye una sección que resume fórmulas importantes. Aunque 
la parte tres no trata en realidad sólo con fórmulas, la tabla PT3.3 se emplea para resumir los algo- 
ritmos expuestos. La tabla proporciona una visión general, que será de gran ayuda para revisar y 
aclarar las principales diferencias entre los métodos. 


PT3.6 MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES 


Se pueden encontrar referencias generales acerca de la solución de ecuaciones lineales simultáneas 
en Faddeev y Faddeeva (1963), Stewart (1973), Varga (1962) y Young (1971). Ralston y Rabinowitz 
(1978) proporcionan un resumen general. 

Hay muchas técnicas avanzadas para aumentar el ahorro de tiempo y/o espacio en la solución 
de ecuaciones algebraicas lineales. La mayoría de éstas se enfocan al aprovechamiento de las pro- 


Tabla PT3.3 Resumen de información importante que se presenta en la parte tres. 


Problemas 
y soluciones 
Método Procedimiento potenciales 
Eliminación am a 3 lc ICI Xx =Cy/ 233 Problemas: 
de Gauss dam dy da | al|> as aa | Al|=>x=(0d- aj) aj Mal condicionamiento 
aa dz 3 l| 4 ag | xy =(C1 — 817X1 — d13X3)/ a11 Redondeo 
División entre cero 
Soluciones: 
Incrementar precisión 
Sustitución Pivoteo parcial 
Descomposición hacia atrás 
Y V de Problemas: 
no Mal condicionamiento 
Descomposición [ a11 a12 a13 1.0 07fd c1 Uy Uy uz] fx d; X1 Redondés 
ed A O CI có E División entre cero 
da da da bar L32 1 ]Ld3 G3 0. 0 u3lbs d; X3 Soluciones: 


Método de 
Gauss-Seidel 


] m se 

x= (01-214 2136) a11 
i_ ¡ 1 

x= (0, - 221% - 273) az 


1 / 
x= (03-a31% — 232%) / a33 


Sustitución hacia adelante 


Continúa iterativamente hasta 
xix 
[222 [100% < e, 
x| 
para todas las x; 


Incrementar precisión 
Pivoteo parcial 


Problemas: 
Divergente o 
converge lentamente 
Soluciones: 
Dominancia 
diagonal 
Relajación 


PT3.6 Métodos avanzados y referencias adicionales 


piedades de las ecuaciones, como simetría y a bandas. En particular se dispone de algoritmos que 
operan sobre matrices dispersas para convertirlas a un formato a bandas mínimo. Jacobs (1977) y 
Tewarson (1973) incluyen información sobre este tema. Una vez que se encuentran en un formato a 
bandas mínimo, existen diversas estrategias de solución eficientes: tal como el método de almace- 
namiento en una columna activa de Bathe y Wilson (1976). 

Además de los conjuntos de ecuaciones n x n, hay otros tipos de sistemas donde el número de 
ecuaciones, m, y el número de incógnitas, n, no son iguales. A los sistemas donde m < n se les cono- 
ce como subdeterminados. En tales casos quizá no haya solución o tal vez haya más de una. Los 
sistemas donde m > n se denominan sobredeterminados. En tales situaciones no hay, en general, so- 
lución exacta. Sin embargo, a menudo es posible desarrollar una solución que intente determinar 
soluciones que estén “lo más cercanas”, para satisfacer todas las ecuaciones de manera simultánea. 
Un procedimiento común consiste en resolver la ecuación en un sentido de “mínimos cuadrados” 
(Lawson y Hanson, 1974; Wilkinson y Reinsch, 1971). Alternativamente, se pueden utilizar métodos 
de programación lineal, con los cuales las ecuaciones se resuelven en un sentido “óptimo”, minimi- 
zando alguna función objetivo (Dantzig, 1963; Luenberger, 1984, y Rabinowitz, 1968). En el capítu- 
lo 15 se describe con mayor detalle este procedimiento. 
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OPTIMIZACIÓN 


PT4.1 MOTIVACIÓN 


La localización de raíces (parte dos) y la optimización están relacionadas, en el sentido de que am- 
bas involucran valores iniciales y la búsqueda de un punto en una función. La diferencia fundamen- 
tal entre ambos tipos de problemas se ilustra en la figura PT4.1. La localización de raíces es la 
búsqueda de los ceros de una función o funciones. En cambio, la optimización es la búsqueda ya sea 
del mínimo o del máximo. 

El óptimo es el punto donde la curva es plana. En términos matemáticos, esto corresponde al valor 
de x donde la derivada f'(x) es igual a cero. Además, la segunda derivada, f”(x), indica si el óptimo es 
un mínimo o un máximo: si f(x) < O, el punto es un máximo; si f”(x) > O, el punto es un mínimo. 

Si comprendemos ahora la relación entre las raíces y el óptimo, es posible sugerir una estrategia 
para determinar este último; es decir, se puede derivar a la función y localizar la raíz (el cero) de la 
nueva función. De hecho, algunos métodos de optimización tratan de encontrar un óptimo resolvien- 
do el problema de encontrar la raíz: f'(x) = 0. Deberá observarse que tales búsquedas con frecuencia 
se complican porque f'(x) no se puede obtener analíticamente. Por lo tanto, es necesario usar aproxi- 
maciones por diferencias finitas para estimar la derivada. 

Más allá de ver la optimización como un problema de raíces, deberá observarse que la tarea de 
localizar el Óptimo está reforzada por una estructura matemática extra que no es parte del encontrar 
una simple raíz. Esto tiende a hacer de la optimización una tarea más manejable, en particular con 
casos multidimensionales. 


PT4.1.1 Métodos sin computadora e historia 


Como se mencionó antes, los métodos de cálculo diferencial aún se utilizan para determinar solu- 
ciones óptimas. Todos los estudiantes de ciencias e ingeniería recuerdan haber resuelto problemas 
de máximos y mínimos mediante la determinación de las primeras derivadas de las funciones en 
sus cursos sobre cálculo. Bernoulli, Euler, Lagrange y otros establecieron los fundamentos del 
cálculo de variaciones, el cual trata con la minimización de funciones. El método de los multipli- 
cadores de Lagrange se desarrolló para optimizar problemas con restricciones, es decir, problemas 
de optimización donde las variables están limitadas en alguna forma. 

El primer avance de importancia en los procedimientos numéricos ocurrió con el desarrollo de 
las computadoras digitales después de la Segunda Guerra Mundial. Koopmans, en el Reino Unido, 
y Kantorovich, en la ex Unión Soviética, trabajaron en forma in- 
dependiente sobre el problema general de distribución a bajo 
costo de artículos y productos. En 1947, un alumno de Koopman, f0) 4 F00)=0 
Dantzig, inventó el método simplex para resolver problemas de 
programación lineal. Este método abrió el camino a muchos in- 
vestigadores hacia otros métodos de optimización con restriccio- 
nes; entre los más notables se encuentran Charnes y sus colegas. 0 
Los métodos de optimización con restricciones también se desa- 
rrollaron en forma rápida debido a la disponibilidad tan amplia 
de computadoras. 


Máximo 


e SI 
Mínimo Ff00)>0 


PT4.1.2 Optimización y la práctica en ingeniería 
, Figura PT4.1 
La mayoría de los modelos matemáticos con que hemos tratado Una función de una sola variable ilustra la diferencia entre 


hasta ahora han sido descriptivos. Es decir, se han obtenido para las raíces y el óptimo. 
simular el comportamiento de un dispositivo o sistema en inge- 
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niería. En cambio, la optimización tiene que ver con la determinación del “mejor resultado”, o solu- 
ción óptima, de un problema. Así, en el contexto del modelado, se les llama con frecuencia modelos 
prescriptivos, puesto que sirven para señalar un curso de acción o el mejor diseño. 

Los ingenieros continuamente tienen que diseñar dispositivos y productos que realicen tareas de 
manera eficiente. Al hacerlo de esta manera, están restringidos por las limitaciones del mundo físico. 
Además, deben mantener costos bajos. Así, los ingenieros siempre se enfrentan a problemas de opti- 
mización que equilibren el funcionamiento y las limitaciones. Algunos ejemplos comunes se mencio- 
nan en la tabla PT4.1. El siguiente ejemplo fue desarrollado para ayudarlo a obtener una visión de la 
manera en que se pueden formular tales problemas. 


EJEMPLO PT.4.1 Optimización del costo de un paracaídas 


Planteamiento del problema A lo largo de este libro, hemos utilizado la caída de un paracai- 
dista para ilustrar diversos temas básicos para la solución de problemas con métodos numéricos. 
Usted puede haber notado que ninguno de tales ejemplos se ocupó de lo que pasa después de que el 
paracaídas se abre. En este ejemplo examinaremos un caso donde el paracaídas se abre, y nos inte- 
resa predecir la velocidad de impacto con el suelo. 

Usted es un ingeniero que trabaja para una institución que lleva abastecimientos a los refugiados 
en una zona de guerra. Los abastecimientos se arrojarán a baja altitud (500 m), de tal forma que la 
caída no sea detectada y que los abastecimientos caigan tan cerca como sea posible del campo de 
refugiados. Los paracaídas se abren en forma inmediata al salir del aeroplano. Para reducir daños, 
la velocidad vertical de impacto debe ser menor a un valor crítico v, = 20 m/s. 

El paracaídas que se usa para la caída se ilustra en la figura PT4.2. El área de la sección trans- 
versal del paracaídas es la de una semiesfera, 


A=2157? (PT4.1) 


La longitud de cada una de las 16 cuerdas, que unen al paracaídas con la masa, está relacionada con 
el radio del paracaídas mediante 


(=4/2r (PT4.2) 


Usted sabe que la fuerza de arrastre del paracaídas es una función lineal del área de su sección 
transversal descrita con la siguiente fórmula: 


c=kA (PT4.3) 


donde c = coeficiente de arrastre (kg/s) y k, =una constante de proporcionalidad que parametriza el 
efecto del área sobre el arrastre [kg/(s - m3)]. 


Tabla PT4.1 Algunos ejemplos comunes de problemas de optimización en ingeniería. 


e Diseño de un avión con peso mínimo y resistencia máxima. 

e Trayectorias óptimas de vehículos espaciales. 

e Diseño de estructuras en la ingeniería civil con un mínimo costo. 

e Planeación de obras para el abastecimiento de agua, como presas, que permitan disminuir daños por inunda- 
ción, mientras se obtiene máxima potencia hidráulica. 

e Predicción del comportamiento estructural minimizando la energía potencial. 

e Determinación del corte de materiales con un mínimo costo. 

e Diseño de bombas y equipos de transferencia de calor con una máxima eficiencia. 

e Maximización de la potencia de salida de circuitos eléctricos y de maquinaria, mientras se minimiza la generación 
de calor. 

e Ruta más corta de un vendedor que recorre varias ciudades durante un viaje de negocios. 

e Planeación y programación óptimas. 

e Análisis estadístico y modelado con un mínimo error. 

e Redes de tubería óptimas. 

e Control de inventario. 

e Planeación del mantenimiento para minimizar costos. 

e Minimización de tiempos de espera. 

e Diseño de sistemas de tratamiento de residuos para cumplir con estándares de calidad del agua a bajo costo. 


PT4.1 Motivación 


También, se puede dividir la carga completa en tantos paquetes como se quiera. Es decir, la masa 
de cada paquete se calcula así 


m= 


donde m = masa de cada paquete (kg), M, = carga total que habrá de arrojarse (kg) y n = número 
total de paquetes. 
Por último, el costo de cada paracaídas está relacionado con su tamaño en una forma no lineal, 


Costo por paracaídas = Cc, + c,f + c,4? (PT4.4) 


donde c,, c, y c, son coeficientes de costo. El término constante, c,, es el costo base de los paracaídas. 
La relación no lineal entre costo y área se debe a que la fabricación de los paracaídas de gran tama- 
ño es más complicada que la de los paracaídas pequeños. 

Determine el tamaño (r) y el número de paracaídas (n) que se obtienen a un mínimo costo y 
que, al mismo tiempo, satisfacen el requerimiento de lograr una velocidad de impacto suficiente- 
mente pequeña. 


Solución El objetivo aquí consiste en determinar la cantidad y el tamaño de los paracaídas que 
minimicen el costo de la operación. El problema tiene restricciones, ya que los paquetes deben tener 
una velocidad de impacto menor al valor crítico. 

El costo se calcula al multiplicar el valor de un solo paracaídas [ecuación (PT4.4)] por el núme- 
ro de paracaídas (n). Así, la función que usted debe minimizar, llamada formalmente función obje- 
tivo, se escribe como 


Minimizar C= n(c, + cf + c,4?) (PT4.5) 


donde C = costo ($) y A y € se calculan con las ecuaciones (PT4.1) y (PT4.2), respectivamente. 
A continuación, se deben especificar las restricciones. En este problema existen dos restriccio- 
nes. Primera, la velocidad de impacto debe ser igual o menor que la velocidad crítica, 


V=V,. (PT4.6) 
Segunda, el número de paquetes debe ser un entero mayor o igual a 1, 
n=1 (PT4.7) 


donde n es un entero. 
En este momento, ya se ha formulado el problema de optimización. Como se observa, es un 
problema con restricciones no lineal. 
Aunque el problema se ha formulado completamente, se debe tener en cuenta 
algo más: ¿cómo se determina la velocidad de impacto v? Recuerde del capítulo 1 


que la velocidad de un objeto que cae se calcula así: 2 


ya E em, (1.10) 
c 400 
donde v = velocidad (m/s), g = aceleración de la gravedad (m/s?), m = masa (kg) y 
1 = tiempo (s). 
Aunque la ecuación (1.10) proporciona una relación entre y y £, lo que se nece- 200 
sita saber es en cuánto tiempo cae la masa. Por lo tanto, es necesaria una relación 
entre la distancia de caída z y el tiempo de caída f. La distancia de caída se calcula [o 
a partir de la velocidad en la ecuación (1.10) mediante la integración 
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Figura PT4.2 
Un paracaídas abierto. 


Impacto 


¿= j a AS (PT4.8) 
0 Cc 


Esta integral se evalúa para obtener Figura PT4.3 


gm gm La altura z y la velocidad v de un paracaí- 
Z=20 1+ 25 (1 emo, (PT4.9) das abierto conforme cae al suelo (z = 0). 
Cc 
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donde z, = altura inicial (m). Esta función, como muestra la gráfica de la figura PT4.3, ofrece una 
manera de predecir z conociendo t. 

Sin embargo, no se necesita z como función de f para resolver este problema. Lo que necesitamos 
es el tiempo requerido por el paquete, al caer, la distancia z,¿. Así, se reconoce que tenemos que re- 
formular la ecuación (PT4.9) como un problema de determinación de raíces. Esto es, se debe encon- 
trar el tiempo en el que z toma el valor de cero, 


2 
fo=0=% EE em, (PT4.10) 
Cc Cc 
Una vez que se calcula el tiempo de impacto, se sustituye en la ecuación (1.10) con la finalidad de 
obtener la velocidad de impacto. 

El planteamiento del problema sería entonces 


Minimizar C= n(c, + c,f + c,4?) (PT4.11) 
sujeta a 
vV= 0. (PT4.12) 
n=1 (PT4.13) 
donde 
A=2nr (PT4.14) 
l=4/Qr (PT4.15) 
c=kaA (PT4.16) 
M, 
m==— (PT4.17) 
n 
m m? 
[ =raíz E a AE 358) (PT4.18) 
Cc Cc 
y= E q ¿ema (PT4.19) 
Cc 


Resolveremos este problema en el ejemplo 15.4 al final del capítulo 15. Por ahora reconozca que 
este problema tiene la mayoría de los elementos fundamentales de otros problemas de optimización, 
que usted enfrentará en la práctica de la ingeniería. Estos son 


+ El problema involucrará una función objetivo que se optimizará. 

+ Tendrá también un número de variables de diseño. Éstas pueden ser números reales o enteros. 
En nuestro ejemplo, dichas variables son r (real) y n (entero). 

» El problema incluye restricciones que consideran las limitaciones bajo las cuales se trabaja. 


Plantearemos una reflexión más antes de proceder. Aunque la función objetivo y las restricciones 
quizá, en forma superficial, parezcan ecuaciones simples [por ejemplo, la ecuación (PT4.12)], de 
hecho, pueden ser sólo la “punta del iceberg”. Es decir, pueden basarse en modelos y dependencias 
complicadas. Por ejemplo, como en este caso, llegan a involucrar otros métodos numéricos [ecuación 
(PT4.18)], lo cual significa que las relaciones funcionales que usted estará usando podrían representar 
cálculos largos y complicados. Por lo que las técnicas que permitan encontrar la solución óptima, y 
que al mismo tiempo simplifiquen las evaluaciones de las funciones, serán valiosas en extremo. 


PT4.2 ANTECEDENTES MATEMÁTICOS 


Existen bastantes conceptos matemáticos que son la base de la optimización. Como creemos que para 
usted éstos serán más relevantes en su forma contextual, se dejará el análisis de los prerrequisitos 
matemáticos específicos hasta que se ocupen. Por ejemplo, se analizarán los importantes conceptos 


PT4.3 Orientación 


del gradiente y el hessiano al inicio del capítulo 14, que trata sobre optimización multivariable sin 
restricciones. Mientras tanto, ahora nos limitaremos al tema más general de cómo se clasifican los 
problemas de optimización. 

Un problema de programación matemática u optimización generalmente se puede establecer 
como 


Determine x, que minimiza o maximiza f(x) 


sujeto a 
d(x) = a, ¡=1,2,....m (PT4.20) 
elx) =b, ¡=1,2,....p (PT4.21) 


donde x es un vector de diseño n-dimensional; f(x) es la función objetivo; d,(x) son las restricciones 
de desigualdad, e,(x) son las restricciones de igualdad, y a; y b, son constantes. 
Los problemas de optimización se clasifican considerando la forma de f(x): 


+ Si f(x) y las restricciones son lineales, tenemos un problema de programación lineal. 

* Si fix) es cuadrática y las restricciones son lineales, tenemos un problema de programación 
cuadrática. 

+ Si f(x) no es lineal ni cuadrática y/o las restricciones no son lineales, tenemos un problema de 
programación no lineal. 


Se dice también que, cuando las ecuaciones (PT4.20) y (PT4.21) se incluyen, se tiene un problema 
de optimización con restricciones; de otra forma, se trata de un problema de optimización sin res- 
tricciones. 

Observe que en problemas con restricciones, los grados de libertad están dados por n-p-m. 
Generalmente, para obtener una solución, p + m debe ser = n. Si p + m > n, se dice que el problema 
está sobrerrestringido. 

Otra forma de clasificar los problemas de optimización es según su dimensionalidad. En gene- 
ral se dividen en unidimensionales y multidimensionales. Como su nombre lo indica, los primeros 
involucran funciones que dependen de una sola variable independiente. Como en la figura PT4.4a, 
la búsqueda consiste, entonces, en ascender o descender picos y valles unidimensionales. Los pro- 
blemas multidimensionales implican funciones que dependen de dos o más variables independientes. 
En el mismo sentido, la optimización bidimensional, de nuevo, se visualiza como una búsqueda de 
picos y valles (figura PT4.4b). Sin embargo, justo como en un paseo campestre, no estamos limita- 
dos a caminar en una sola dirección; en lugar de esto se examina la topografía para alcanzar el 
objetivo en forma eficiente. 

Finalmente, el proceso de encontrar un máximo o de encontrar un mínimo es, en esencia, idén- 
tico, ya que un mismo valor, por ejemplo x*, minimiza f(x) y maximiza —f(x). Esta equivalencia se 
ilustra en forma gráfica, para una función unidimensional, en la figura PT4.4a. 


PT4.3 ORIENTACIÓN 


Resulta útil alguna orientación antes de desarrollar los métodos numéricos para la optimización. Lo 
siguiente lleva la intención de dar una visión general del material en la parte cuatro. Además, se 
presentan algunos objetivos para ayudarlo a enfocar sus esfuerzos cuando se estudie el material. 


PT4.3.1 Alcance y presentación preliminar 


La figura PT4.5 es una representación esquemática de la organización de la parte cuatro. Examine esta 
figura con cuidado, comenzando desde arriba y después yendo en sentido de las manecillas del reloj. 

Después de la presente introducción, el capítulo 13 se dedica a la optimización unidimensional 
sin restricciones. Se presentan métodos para determinar el mínimo o el máximo de una función con 
una sola variable. Se examinan tres métodos: búsqueda de la sección dorada, interpolación cuadrá- 
tica y el método de Newton. También se describe un enfoque híbrido avanzado, el método de Brent, 
que combina la confiabilidad de la sección dorada con la rapidez de la interpolación cuadrática. 
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Figura PT4.4 

a) Optimización unidimensional. Esta figura 
también ilustra cómo la minimización de fx) 
es equivalente a la maximización de Ax). b) 
Optimización bidimensional. Observe que esta 
figura puede tomarse para representar ya sea 
una maximización (los contornos aumentan 
de elevación hasta un máximo como en una 
montaña), o una minimización (los contornos 
disminuyen de elevación hasta un mínimo 
como un valle). 


FO 4 


Mínimo f(x) 


F(x) 


sé Máximo —f(x) 


$ (%) 


FG y) 


Óptimo f(x*, 0) 


b) 


El capítulo 14 cubre dos tipos generales de métodos para resolver problemas de optimización 
multidimensional sin restricciones. Los métodos directos, como búsquedas aleatorias, búsquedas 
univariables y búsquedas de patrones, no requieren la evaluación de las derivadas de la función. Por 
otro lado, los métodos de gradiente utilizan la primera o la segunda derivada para encontrar el óptimo. 
En este capítulo se introduce el gradiente y el hessiano, que son las representaciones multidimensio- 
nales de la primera y la segunda derivada. El método de paso ascendentel/descendente se estudia 
después con detalle. A esto le siguen descripciones de algunos métodos avanzados: el gradiente con- 
jugado, el método de Newton, el método de Marquardt y los métodos cuasi-Newton. 

El capítulo 15 se dedica a la optimización con restricciones. La programación lineal se descri- 
be con detalle usando tanto la representación gráfica como el método simplex. El análisis detallado 
de optimización con restricciones no lineal está fuera del alcance de este texto; no obstante, se 
ofrece una visión general de los principales métodos. Además, se ilustra cómo tales problemas (jun- 
to con los estudiados en los capítulos 13 y 14) se resuelven con paquetes de software, como Excel, 
MATLAB y Mathcad. 

En el capítulo 16 se extienden los conceptos anteriores a problemas que se presentan en la in- 
geniería. Se utilizan las aplicaciones en ingeniería para ilustrar cómo se formulan los problemas de 
optimización, y para dar una visión sobre la aplicación de las técnicas de solución en la práctica 
profesional. 

Se incluye un epílogo al final de la parte cuatro. Éste contiene un repaso de los métodos anali- 
zados en los capítulos 13, 14 y 15. Dicho repaso da una descripción de las ventajas y desventajas 
relacionadas con el uso apropiado de cada técnica. Esta sección también presenta referencias acerca 
de algunos métodos numéricos que van más allá del alcance de este libro. 


PT4.3.2 Metas y objetivos 


Objetivos de estudio Después de estudiar la parte cuatro, usted tendrá suficiente información 
para abordar con éxito una amplia variedad de problemas que se presentan en la ingeniería, relacio- 
nados con la optimización. En general, usted deberá dominar las técnicas, habrá aprendido a evaluar 
su confiabilidad y será capaz de analizar métodos alternativos para un problema específico. Además, 
de estas metas generales, deberán asimilarse los conceptos específicos dados en la tabla PT4.2 para 
un aprendizaje completo del material de la parte cuatro. 


Objetivos de cómputo Usted deberá ser capaz de escribir un subprograma que lleve a cabo una 
búsqueda simple unidimensional (como la búsqueda de la sección dorada o la interpolación cuadrá- 
tica) y multidimensional (como el método de búsqueda aleatoria). Además, los paquetes de software 
como Excel, MATLAB o Mathcad tienen varias capacidades para optimización. Usted puede usar 
esta parte del libro para familiarizarse con todas estas capacidades. 


PT4.3 Orientación 


PT4.2 
Antecedentes 
matemáticos 


PT4.3 
Orientación 13,1 


Búsqueda de la 
sección dorada 


PT4.1 
Motivación 


PARTE 4 
Optimización 


13.2 
Interpolación 
cuadrática 


PT4.5 
Referencias 
adicionales 


CAPÍTULO 13 
Optimización 
unidimensional 
sin restricciones 


13.3 
Método de 
Newton 


PT4.4 
Ventajas y 
desventajas 


13.4 
Método de 
Brent 


16.4 
Ingeniería 
mecánica 


14.1 


CAPÍTULO 14 
Optimización 
multidimensional 
sin restricciones 


CAPÍTULO 16 
Estudio 
de casos 


16.3 
Ingeniería 
eléctrica 


14.2 
Métodos de 
gradiente 


CAPÍTULO 15 


16.2 
Ingeniería 
civil 


Optimización 
con restricciones 


16.1 
Ingeniería 
química 


15.1 
Programación 
lineal 


15.2 
Optimización 

restringida 
no lineal 


15.3 
Paquetes de 
software 


Figura PT4.5 
Representación de la organización del material en la parte cuatro: Optimización. 


Tabla PT4.2 Objetivos específicos de estudio de la parte cuatro. 


Entender por qué y dónde se presenta la optimización al resolver problemas de ingeniería. 

Comprender los principales elementos del problema de optimización general: función objetivo, variables de decisión y restricciones. 
Ser capaz de distinguir entre la optimización lineal y la no lineal, y entre problemas con restricciones y sin restricciones. 

Poder definir la razón dorada y comprender cómo hace que la optimización unidimensional sea eficiente. 


A ISS 


Métodos 
directos 
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Localizar el óptimo de una función en una sola variable mediante la búsqueda de la sección dorada, la interpolación cuadrática y el método de 


Newton. También, reconocer las ventajas y desventajas de tales métodos, especialmente en relación con los valores iniciales y la convergencia. 


a 


interpolación parabólica. 
7. Escribir un programa y encontrar el óptimo de una función multivariada usando la búsqueda aleatoria. 
8. Comprender las ideas de los patrones de búsqueda, las direcciones conjugadas y el método de Powell. 
9. Definir y evaluar el gradiente y el hessiano de una función multivariada, tanto en forma analítica como numérica. 
O. Calcular a mano el óptimo de una función con dos variables, usando el método de paso ascendente-descendente. 
1 


12. Reconocer y plantear un problema de programación lineal para representar problemas aplicables a la ingeniería. 
13. Resolver un problema de programación lineal bidimensional con ambos métodos: el gráfico y el simplex. 

14. Comprender los cuatro posibles resultados de un problema de programación lineal. 

15. Plantear y resolver problemas de optimización con restricciones no lineales utilizando un paquete de software. 


Entender cómo el método de optimización de Brent combina la confiabilidad de la búsqueda de la sección dorada con la rapidez de la 


Comprender las ideas básicas de los métodos del gradiente conjugado, de Newton, de Marquardt y de cuasi-Newton. En particular, enten- 
der las ventajas y las desventajas de los diferentes métodos, y reconocer cómo cada uno mejora el de paso ascendente-descendente. 


fot 


Figura 13.1 


Optimización unidimensional 
sin restricciones 


Esta sección describirá técnicas para encontrar el mínimo o el máximo de una función de una sola 
variable, f(x). Una imagen útil que muestra lo anterior es la consideración unidimensional a la “mon- 
taña rusa”, como la función representada en la figura 13.1. Recuerde que en la parte dos, la locali- 
zación de una raíz fue complicada por el hecho de que una sola función puede tener varias raíces. 
De manera similar, los valores óptimos tanto locales como globales pueden presentarse en problemas 
de optimización. A tales casos se les llama multimodales. En casi todos los ejemplos, estaremos 
interesados en encontrar el valor máximo o mínimo absoluto de una función. Así, debemos cuidar 
de no confundir un óptimo local con un óptimo global. 

Distinguir un extremo global de un extremo local puede ser generalmente un problema difícil. 
Existen tres formas comunes de resolver este problema. Primero, una idea del comportamiento de las 
funciones unidimensionales algunas veces llega a obtenerse en forma gráfica. Segundo, determinar 
el valor óptimo con base en valores iniciales, los cuales varían ampliamente y son generados quizá en 
forma aleatoria, para después seleccionar el mayor de éstos como el global. Por último, cambiar el 
punto de inicio asociado con un óptimo local y observar si la rutina empleada da un mejor punto, o 
siempre regresa al mismo punto. Aunque estos métodos tienen su utilidad, el hecho es que en algunos 
problemas (usualmente los más grandes) no existe una forma práctica de asegurarse de que se ha lo- 
calizado un valor óptimo global. Sin embargo, aunque debe tenerse cuidado se tiene la fortuna de que 
en muchos problemas de la ingeniería se localiza el óptimo global en forma no ambigua. 

Como en la localización de raíces, los problemas de optimización unidimensionales se pueden 
dividir en métodos cerrados y métodos abiertos. Como se describirá en la próxima sección, la bús- 
queda de la sección dorada es un ejemplo de un método cerrado que depende de los valores iniciales 
que encierran un solo valor óptimo. Esto va seguido de un enfoque alternativo, la interpolación 
parabólica, que a menudo converge más rápidamente que la búsqueda de la sección dorada, pero 
algunas veces diverge. 

Otro método que se describe en este capítulo es un método abierto basado en la idea, prove- 
niente del cálculo, de que se pueden hallar el mínimo o el máximo resolviendo f'(x) = 0. Esto reduce 
el problema de optimización a encontrar la raíz de f'(x) usando técnicas del tipo que se describen en 
la parte dos. Se demostrará una versión de este enfoque: el méto- 
do de Newton. 

Finalmente se describe un enfoque híbrido avanzado: el mé- 
todo de Brent. Éste combina la confiabilidad de la búsqueda de la 
sección dorada con la rapidez de la interpolación parabólica. 


13.1 BÚSQUEDA DE LA SECCIÓN DORADA 


En la búsqueda de la raíz de una ecuación no lineal, el objetivo 
era encontrar el valor de x que diera cero al sustituir en la función 
FG). La optimización en una sola variable tiene como objetivo 
encontrar el valor de x que da un extremo, ya sea un máximo o un 


Una función que se aproxima asintóticamente a cero en mínimo de f(x). 


más y menos «e y que tiene dos puntos máximos y dos 
puntos mínimos en la vecindad del origen. Los dos puntos 
a la derecha son los óptimos locales; mientras que los dos 
de la izquierda son globales. 


La búsqueda de la sección dorada es una técnica de búsque- 
da para una sola variable, sencilla y de propósito general. Es igual 
en esencia al método de la bisección para localizar raíces (capí- 
tulo 5). Recuerde que la bisección depende de la definición de un 


13.1 Búsqueda de la sección dorada 


intervalo, especificado por los valores iniciales inferior (x,) y superior (x,), que encierran una sola 
raíz. La presencia de una raíz entre estos límites se verificó determinando que f(x,) y f(x, ) tuvieran 
signos diferentes. La raíz se estima entonces como el punto medio de este intervalo, 


_X +X, 
q 


El paso final en una iteración por bisección permite determinar un intervalo más pequeño. Esto se 
logra al reemplazar cualquiera de los límites, x, o x,, que tuvieran un valor de la función con el mis- 
mo signo que f(x,). Un efecto útil de este método es que el nuevo valor x, reemplazará a uno de los 
límites anteriores. 

Es posible desarrollar un procedimiento similar para localizar el valor óptimo de una función 
unidimensional. Por simplicidad, nos concentraremos en el problema de encontrar un máximo. 
Cuando se analice el algoritmo de cómputo, se describirán las pequeñas modificaciones necesarias 
para determinar un mínimo. 

Como en el método de la bisección, se puede comenzar por definir un intervalo que contenga 
una sola respuesta. Es decir, el intervalo deberá contener un solo máximo, y por esto se llama uni- 
modal. Podemos adoptar la misma nomenclatura que para la bisección, donde x, y x, definen los 
límites inferior y superior, respectivamente, del intervalo. Sin embargo, a diferencia de la bisección 
se necesita una nueva estrategia para encontrar un máximo dentro del intervalo. En vez de usar so- 
lamente dos valores de la función (los cuales son suficientes para detectar un cambio de signo y, por 
lo tanto, un cero), se necesitarán tres valores de la función para detectar si hay un máximo. Así, hay 
que escoger un punto más dentro del intervalo. Después, hay que tomar un cuarto punto. La prueba 
para el máximo podrá aplicarse para determinar si el máximo se encuentra dentro de los primeros 
tres o de los últimos tres puntos. 

La clave para hacer eficiente este procedimiento es la adecuada elección de los puntos interme- 
dios. Como en la bisección, la meta es minimizar las evaluaciones de la función reemplazando los 
valores anteriores con los nuevos. Esta meta se puede alcanzar especificando que las siguientes dos 
condiciones se satisfagan (figura 13.2): 


Ll =£,+£, (13.1) 
A 
Le, (13.2) 


La primera condición especifica que la suma de las dos sublongitudes £, y £, debe ser igual a la 
longitud original del intervalo. La segunda indica que el cociente o razón entre las longitudes debe 
ser igual. La ecuación (13.1) se sustituye en la (13.2), 
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lt _£, 
A +£, £, (13.3) FO) 
Si se toma el recíproco y R = £,/£,, se llega a 
1 
air (13.4) Máximo 
o 
de 
R+R-1=0 (13.5) RA 
iteración ”, Lo 
de la cual se obtiene la raíz positiva >> t; 
Segunda 
-1+,.11-4(-1 | iteración > 
R= E ( 1 =0.61803... (13.6) a 
Figura 13.2 


Este valor, que se conoce desde la antigijedad, se llama razón dorada o razón El paso inicial en el algoritmo de búsque- 
áurea (véase el cuadro 13.1). Como permite encontrar el valor óptimo en forma ga de la sección dorada consiste en elegir 
eficiente, es el elemento clave del método de la sección dorada que hemos estado dos puntos interiores de acuerdo con la 


desarrollando. Ahora construyamos un algoritmo para implementar este procedi- razón dorada. 
miento en la computadora. 
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Capítulo 13 Optimización unidimensional sin restricciones 


Cuadro 13.1 La razón dorada y los números de Fibonacci 


0.61803 


Figura 13.3 

El Partenón de Atenas, Grecia, fue construido en el siglo v 
antes de Cristo. Sus dimensiones frontales se ajustan casi 
exactamente a un rectángulo dorado. 


FO 


Eliminar 
e 


Figura 13.4 
a) El paso inicial del algoritmo de bús- 
queda de la sección dorada involucra 


En muchas culturas, a ciertos números se les otorgan algunas cuali- 
dades. Por ejemplo, en Occidente se suele decir “el 7 de la suerte” y 
“el funesto viernes 13”. Los antiguos griegos llamaron al siguiente 
número la “razón dorada” o áurea: 


5-1 
2 


=0.61803... 


Esta razón fue empleada con un gran número de propósitos, inclu- 
yendo el desarrollo del rectángulo de la figura 13.3. Tales proporcio- 
nes fueron consideradas por los griegos como estéticamente 
agradables. Entre otras cosas, muchos de los templos siguieron esta 
forma. 

La razón dorada se relaciona con una importante sucesión mate- 
mática conocida como los números de Fibonacci, que son 


0, 1, 1,2, 3, 5, 8, 13, 21, 34,... 


Cada número después de los dos primeros representa la suma de 
los dos precedentes. Esta secuencia aparece en diversas áreas de la 
ciencia y la ingeniería. En el contexto del presente análisis, una in- 
teresante propiedad de la sucesión de Fibonacci relaciona la razón 
entre números consecutivos de la serie; es decir, 0/1 = 0, 1/1 =1, 1/2 
= 0.5, 2/3 = 0.667, 3/5 = 0.6, 5/8 = 0.625, 8/13 = 0.615, y así sucesi- 
vamente. La razón entre números consecutivos se va aproximando a 
la razón dorada. 


Extremo 
(máximo) 


F(x) 


escoger dos puntos interiores de acuer- 
do con la razón dorada. b) El segundo 

paso implica definir un nuevo intervalo 
que incluya el valor óptimo. 


=Y 
=Y 


x, anterior x, anterior 
a) b) 


Como se mencionó antes y se ilustra en la figura 13.4, el método comienza con dos valores 
iniciales, x, y x,, que contienen un extremo local de f(x). Después, se eligen dos puntos interiores x; 


y x, de acuerdo con la razón dorada, 


d XX 
2 Q, 1) 

x=x+d 

Xx, =X,-d 


La función se evalúa en estos dos puntos interiores. Dos casos pueden presentarse: 


1. Si, como es el caso en la figura 13.4, f(x,) > [f(x,), entonces el dominio de x a la izquierda de x,, 
de x, a x,, se puede eliminar, ya que no contiene el máximo. En este caso, x, será el nuevo x, en 


la siguiente vuelta. 


2. Si f(x,) > K(x,), entonces el dominio de x a la derecha de x,, de x, a x, podrá eliminarse. En este 
caso, x, será el nuevo x, en la siguiente iteración. 


13.1 Búsqueda de la sección dorada 


Ahora, ésta es la ventaja real del uso de la razón dorada. Debido a que los x, y x, originales se 
han escogido mediante la razón dorada, no se tienen que recalcular todos los valores de la función 
en la siguiente iteración. Por ejemplo, en el caso ilustrado en la figura 13.4, el anterior x, será el 
nuevo x,. Esto significa que ya se tiene el valor para el nuevo f(x,), puesto que es el mismo valor de 
la función en el anterior x,. 

Para completar el algoritmo, ahora sólo se necesita determinar el nuevo x,. Esto se realiza usan- 
do la misma proporcionalidad que antes, 


5 


1 
Xx =X,+ e e) 


Un procedimiento similar podría usarse en el caso en que el óptimo caiga del lado izquierdo del 
subintervalo. 

Conforme las iteraciones se repiten, el intervalo que contiene el extremo se reduce rápidamente. 
De hecho, en cada iteración el intervalo se reduce en un factor de la razón dorada (aproximadamen- 
te 61.8%). Esto significa que después de 10 iteraciones, el intervalo se acorta aproximadamente en 
0.618'” o 0.008 o 0.8% de su longitud inicial. Después de 20 iteraciones, se encuentra en 0.0066%. 
Esta reducción no es tan buena como la que se alcanza con la bisección; aunque éste es un problema 
más difícil. 


EJEMPLO 13.1 Búsqueda de la sección dorada 


Planteamiento del problema Use la búsqueda de la sección dorada para encontrar el máximo de 


2 


x 
=2 =— 
FO) sen x 0 


dentro del intervalo x,=0 y x, =4. 


Solución Primero, se utiliza la razón dorada para crear los dos puntos interiores 


q 
2 


x= 042.472 = 2.472 
x, =4-2.472 = 1.528 


(4-0)=2.472 


Se evalúa la función en los puntos interiores 


1.528? 


FGe,) = (1.528) = 2 sen (1.528) — 0 


=1.765 


FO) =$Q.472) = 0.63 


Debido a que f(x») > f(x,), el máximo está en el intervalo definido por x,, x, y x,. Así, para el 
nuevo intervalo, el límite inferior sigue siendo x, = 0, y x, será el límite superior; esto es, x, = 2.472. 
Además, el primer valor x, pasa a ser el nuevo x,; es decir, x, = 1.528. Asimismo, no se tiene que 
recalcular f(x,) ya que se determinó en la iteración previa como (1.528) = 1.765. 

Todo lo que falta es calcular el nuevo valor de d y x,, 


d= loan 0)=1.528 


x, = 2.4721 - 1.528 = 0.944 


La evaluación de la función en x, es f(0.994) = 1.531. Como este valor es menor que el valor de 
la función en x,, el máximo está en el intervalo dado por x,, Xx; Y X,. 
Si el proceso se repite, se obtienen los resultados tabulados a continuación: 
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¡ Xx 0) x f(x) X f(x) Xu f(x.) d 

1 0 0 1.5279 1.7647 2.4721 0.6300 4.0000 -3.1136 2.4721 
2 0 0 0.9443 .5310 1,5278) 1.7647 2.4721 0.6300 1.5279 
3 0.9443 1.5310 1.5279 1.7647 1.8885 1.5432 2.4721 0.6300 0.9443 
4 0.9443 1.5310 1.3050 1.7595 1.5279 1.7647 1.8885 1.5432 0.5836 
5 1.3050 1.7595 1.5279 1.7647 1.6656 1.7136 1.8885 1.5432 0.3607 
6 1.3050 1.7595 1.4427 ISS 1.5279 1.7647 1.6656 1.7136 0.2229 
7 1.3050 1.7595 1.3901 1742 1.4427 1.133 1.5279 1.7647 0.1378 
8 1.3901 1.7742 1.4427 1 


SS 1.4752 1.7732 1.5279 1.7647 0.0851 


Observe que el máximo está resaltado en cada iteración. Después de ocho iteraciones, el máxi- 
mo se encuentra en x = 1.4427 con un valor de la función 1.7755. Así, el resultado converge al valor 
verdadero, 1.7757, en x= 1.4276. 


Recuerde que en la bisección (sección 5.2.1), se puede calcular un límite superior exacto para 
el error en cada iteración. Usando un razonamiento similar, un límite superior para la búsqueda de 
la sección dorada se obtiene como sigue. Una vez que se termina una iteración, el valor óptimo es- 
tará en uno de los dos intervalos. Si x, es el valor óptimo de la función, estará en el intervalo inferior 
(%,, X2, X1). Si x, es el valor óptimo de la función, estará en el intervalo superior (x,, x,, x,). Debido a 
que los puntos interiores son simétricos, se utiliza cualquiera de los casos para definir el error. 

Observando el intervalo superior, si el valor verdadero estuviera en el extremo izquierdo, la 
máxima distancia al valor estimado sería 

Ax, =X,—X> 

=X, + RG, Sn x) — Xy + RG, NN x) 
= 07 > Xu) + 2R(x,, Fe x)) 
= QR a Da, = x) 
o 0.236(x, — X;). 
Si el valor verdadero estuviera en el extremo derecho, la máxima distancia al valor estimado sería 
Ax, = Xy AX 


= Xy 2 X— RG, —x)) 


= el > RI, E x) 
o 0.382(x, — x;). Por lo tanto, este caso podría representar el error máximo. Este resultado después 
se normaliza al valor óptimo de esa iteración, x¿p,, para dar 
XxX 
€, =(1-R) 2 |100% . 
x 


ópt 


Esta estimación proporciona una base para terminar las iteraciones. 

En la figura 13.5a se presenta el pseudocódigo del algoritmo para la búsqueda de la sección do- 
rada en la maximización. En la figura 13.5b se muestran las pequeñas modificaciones para convertir 
el algoritmo en una minimización. En ambas versiones el valor x para el óptimo se regresa como el 
valor de la función (dorado). Además, el valor de f(x) óptimo se regresa como la variable f(x). 

Usted se preguntará por qué hemos hecho énfasis en reducir las evaluaciones de la función para 
la búsqueda de la sección dorada. Por supuesto, para resolver una sola optimización, la velocidad 
ahorrada podría ser insignificante. Sin embargo, existen dos importantes casos donde minimizar el 
número de evaluaciones de la función llega a ser importante. Éstos son: 


1. Muchas evaluaciones. Hay casos donde el algoritmo de búsqueda de la sección dorada puede ser 
parte de muchos otros cálculos. Entonces, éste podría ser llamado muchas veces. Por lo tanto, 
mantener el número de evaluaciones de la función en un mínimo ofrecería dar grandes ventajas 
en tales casos. 


FUNCTION Gold (xlow, xhigh, maxit, es, fx) 
R= (5% - 1)/2 

xt = xlow; xu = xhigh 

¡ter = 1 

d=R*(xu- xt) 

xl = xl + d; x2 = xu - d 


fl = f(x1) 
f2 = fF(x2) 
E EN, 
xopt = x1 
fx = fl 
ELSE 
xopt = x2 
fx = f2 
END IF 
DO 
d = R*d 
EFI > 2 TIEN 
xl = x2 
x2 = x1 
x1l = xt+d 
f2= fl 
fl = f(x1) 
ELSE 
xu= x1 
xl = x2 
x2 = xu-d 
fl = f2 
f2 = f(x2) 
END IF 


¡ter = ¡ter+1 
A A E 
xopt = x1 
fx = fl 
ELSE 
xopt = x2 
fx = f2 
END IF 
IF xopt + 0. THEN 


ea = (1.-R) *ABS((xu - xt)/xopt) * 100. 


END IF 

IF ea < es OR ¡ter 2 maxit EXIT 
END DO 
Gold = xopt 
END Gold 

a) Maximización 


Figura 13.5 
Algoritmo para la búsqueda de la sección dorada. 


13.1 Búsqueda de la sección dorada 285 


ISR EIN) 
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IS EIN) 


b) Minimización 


2. Evaluaciones que toman mucho tiempo. Por razones didácticas, se usan funciones simples en 
la mayoría de nuestros ejemplos. Usted deberá tener en cuenta que una función puede ser muy 
compleja y consumir mucho tiempo en su evaluación. Por ejemplo, en una parte posterior de este 
libro, se describirá cómo se utiliza la optimización para estimar los parámetros de un modelo 
que consiste de un sistema de ecuaciones diferenciales. En tales casos, la “función” comprende 
la integración del modelo que tomaría mucho tiempo. Cualquier método que minimice tales 


evaluaciones resultará provechoso. 
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13.2 INTERPOLACIÓN PARABÓLICA 


Aproximación 
parabolica La interpolación parabólica aprovecha la ventaja de que un polinomio de 
del máximo Pp Pp ap Ñ y q La Ñ 
segundo grado con frecuencia proporciona una buena aproximación a la 
Función forma de f(x) en las cercanías de un valor óptimo (figura 13.6). 
a Sai Exactamente del mismo modo en el que sólo hay una línea recta que 
conecte dos puntos, sólo hay una ecuación cuadrática polinómica o pará- 
bola que conecte tres puntos. De esta forma, si se tiene tres puntos que 
contienen un punto óptimo, se ajusta una parábola a los puntos. Después 
se puede derivar e igualar el resultado a cero, y así obtener una estimación 
de la x óptima. Es posible demostrar mediante algunas operaciones alge- 


braicas que el resultado es 


Figura 13.6 


Descripción gráfica de la interpolación parabólica. 


E FAR ADAGIO 0 4 FIG 4) 
2 f(x Mo, 2) +2. (M0, = +2 fx, Mp — X,) 


(13.7) 


3 


donde x,, x, y x, son los valores iniciales, y x, es el valor de x que corres- 
ponde al valor máximo del ajuste parabólico de los valores iniciales. 
Después de generar el nuevo punto, hay dos estrategias para seleccionar 
los puntos para la siguiente iteración. El enfoque más sencillo, que es similar al método de la secante, 
es simplemente asignar los nuevos puntos en forma secuencial. Es decir, para la nueva iteración, z, = 
Zp 21, = 2, y 2, = 23. Alternativamente, como se ilustra en el siguiente ejemplo, se puede emplear un 
enfoque de regionalización, similar a la bisección o la búsqueda de la sección dorada. 


EJEMPLO 13.2 Interpolación parabólica 


Planteamiento del problema Use la interpolación parabólica para aproximar el máximo de 


2 


y? 
x)=2senx-— 
Fx) 16 

con los valores iniciales x=0,x,=1 y x,=4. 


Solución Se evalúa la función en los tres valores iniciales, 


x =0 Rx) =0 
1=1 Roc) = 1.5829 
1=4 00) =3.1136 


y sustituyendo en la ecuación (13.7) se obtiene, 


-0(17 -47)+1.5829(4* - 0?) +(-3.1136)(0? -1*) 
2(0(1— 4) +2(1.58291(4 — 0) + 2(3.1136,(0—1) 


para la cual el valor de la función es (1.5055) = 1.7691. 

Después, se emplea una estrategia similar a la de la búsqueda de la sección dorada para deter- 
minar qué punto se descartará. Ya que el valor de la función en el nuevo punto es mayor que en 
el punto intermedio (x,) y el nuevo valor de x está a la derecha del punto intermedio, se descarta el 
valor inicial inferior (x,). Por lo tanto, para la próxima iteración, 


= 1.5055 


3 


%=1 Roto) = 1.5829 
x= 1.5055 Roc) = 1.7691 
1=4 $00) =3.1136 


los valores se sustituyen en la ecuación (13.7) para obtener 
_ 1.5829(1.5055? — 4?) +1.7691(4* -1%)+(3.1136)(1? - 1.5055?) 
2(1.5829)(1.5055—4)+2(1.76911(4—1)+ 2(3.1136)(1 1.5055) 
= 1.4903 


X3 


13.3 Método de Newton 


para el cual el valor de la función es (1.4903) = 1.7714. 
El proceso se puede repetir, dando los resultados tabulados abajo: 


Í Xo f(Xxo) X1 fx) X f(x>) X3 fx) 
1 0.0000 0.0000 1.0000 1.5829 4.0000 -3.1136 1.5055 1.7691 
2 1.0000 1.5829 1.5055 1.7691 4.0000 -3.1136 1.4903 1.7714 
3 1.0000 1.5829 1.4903 1.7714 1.5055 1.7691 1.4256 1.7757 
4 1.0000 1.5829 1.4256 1.7757 1.4903 1.7714 1.4266 1.7757 
5 1.4256 1.7757 1.4266 1.7757 1.4903 1.7714 1.4275 1.7757 


Así, con cinco iteraciones, el resultado converge rápidamente al valor verdadero: 1.7757 en x= 1.4276. 


Debemos mencionar que como en el método de la falsa posición, en la interpolación parabólica 
puede ocurrir que sólo se retenga un extremo del intervalo. Así, la convergencia puede ser lenta. 
Como prueba de lo anterior, observe que en nuestro ejemplo, 1.0000 fue un punto extremo en la 
mayoría de las iteraciones. 

Este método, así como otros que usan polinomios de tercer grado, se pueden formular como 
parte de los algoritmos que contienen tanto pruebas de convergencia, como cuidadosas estrategias 
de selección para los puntos que habrán de retenerse en cada iteración y formas para minimizar la 
acumulación del error de redondeo. 


13.3 MÉTODO DE NEWTON 


Recuerde que el método de Newton-Raphson del capítulo 6 es un método abierto que permite en- 
contrar la raíz x de una función de tal manera que f(x) = 0. El método se resume como 


A Fx) 
Xi41 E X; , 
F(x,) 
Se utiliza un método abierto similar para encontrar un valor óptimo de f(x) al definir una nueva 
función, g(x) = f'(x). Así, como el mismo valor óptimo x* satisface ambas funciones 


P0*) = g(1*) =0 
se emplea lo siguiente 


A+ 1 = 1 aL 
JA) 


como una técnica para encontrar el mínimo o máximo de f(x). Se deberá observar que esta ecuación 
también se obtiene escribiendo una serie de Taylor de segundo grado para f(x) e igualando la deri- 
vada de la serie a cero. El método de Newton es abierto y similar al de Newton-Raphson, pues no 
requiere de valores iniciales que contengan al óptimo. Además, también tiene la desventaja de que 
llega a ser divergente. Por último, usualmente es una buena idea verificar que la segunda derivada 
tenga el signo correcto para confirmar que la técnica converge al resultado deseado. 


(13.8) 


EJEMPLO 13.3 Método de Newton 


Planteamiento del problema Con el método de Newton encuentre el máximo de 


pe) 


x 
=2 =— 
FO) sen x 10 


con un valor inicial de x, = 2.5. 


Solución La primera y segunda derivadas de la función se calculan para obtener 
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Figura 13.7 
Pseudocódigo para 

el algoritmo de Brent 
para hallazgo de mí- 
nimos basado en un 
archivo M de MATLAB 
desarrollado por Cleve 
Moler (2005). 
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F'(x)=2 cos e 


f(x) =-—2 sen x= 


las cuales se sustituyen en la ecuación (13.8) para llegar a 


Function fminsimp(x1, xu) 
tol = 0.000001; phi = (1+/5)/2; rho = 2 — phi 
u= x1 + rho*(xu — X1); v= u;w= uu; x= uu 
fu= f(U); fv= fu; fw= fu; fx = fu 
xm= 0.5*(x1 + xu); d= 0;e= 0 
DO 

IF |x= xm| <= tol EXIT 

para = le| > tol 


IF para THEN (Prueba del ajuste parabólico) 
r= (x= wX*(fx — fv); q =(x — V)*(fx — fw) 
p= (x— v)*g — (x= w)*r; s = 2*(q — r) 
IF Ss > 0 THEN p= -p 
s =|s| 
' Is the parabola acceptable? 
para = |p| < |0.5*s*e| And p > s*(x1 — x) And p < s*(xu — x) 
IF para THEN 
e= d; d= p/s 
ENDIF 
ENDIF 
IF Not para THEN 
IF x= xm THEN 


(Paso de interpolación parabólica) 


(Paso de búsqueda de sección dorada) 


e=xl-x 
ELSE 
e= Xu—= Xx 
ENDIF 
d = rho*e 
ENDIF 


u=x=+d; fu= f(u) 
IF fu =< fx THEN 
IFU= x THEN 
EX 
ELSE 
xU= X 
ENDIF 
Vv=w; fv= fw; w= x; fw= fx; x= u; fx= fu 
ELSE 
IF U< x THEN 
x=. 
ELSE 
xu=u 
ENDIF 
IF fu < fw Or w= x THEN 
V w; fv fw; w= u; fw fu 
ELSEIF fu < fv Or v= x Or v = w THEN 
v= uu; fv= fu 
ENDIF 
ENDIF 
xm= 0.5*(x1 + Xu) 
ENDDO 
fminsimp = fu 
END fminsimp 


(Actualización X1, XU, X, V, W, XM) 


13.4 Método de Brent 


2 cos x, —x,/5 
, X.— 
2 7 sex =1/5 


Al sustituir el valor inicial se obtiene 


2c082.5—2. 
a 


—2 sen2.5-1/5 


para la cual el valor de la función es 1.57859. La segunda iteración da 


x, =0.995 2c050.995—0.995/5 146901 
—2 sen 0.995-1/5 


que tiene como valor de la función 1.77385. 
El proceso se repite, dando los resultados abajo tabulados: 


1] x foo fo f"00 

0 2.5 0.57194 -2.10229 -1.39694 
1 0.99508 1.57859 0.88985 -1.87761 
2 1.46901 1.77385 -0.09058 -2.18965 
3 1.42764 1.77573 -0.00020 -2.17954 
4 1.42755 1.77573 0.00000 -2.17952 


Así, después de cuatro iteraciones, el resultado converge en forma rápida al valor verdadero. 


Aunque el método de Newton funciona bien en algunos casos, no es práctico en otros donde 
las derivadas no se pueden calcular fácilmente. En tales casos, hay otros procedimientos que no 
implican la evaluación de la derivada. Por ejemplo, se puede desarrollar una versión del método de 
Newton parecida al de secante usando aproximaciones de diferencias finitas para las evaluaciones 
de derivada. 

Una desventaja importante de este método es que llega a diverger según sea la naturaleza de la 
función y la calidad del valor inicial. Así, usualmente se emplea sólo cuando se está cerca del valor 
óptimo. Las técnicas híbridas que usan métodos cerrados lejos del óptimo y los métodos abiertos 
cercanos al óptimo intentan aprovechar las fortalezas de ambos procedimientos. 


13.4 MÉTODO DE BRENT 


Recuerde que en la sección 6.4 se describió el método de Brent para la ubicación de raíces. Este 
método híbrido combinaba varios métodos de búsqueda de raíces en un solo algoritmo que equili- 
braba confiabilidad con eficiencia. 

Brent también desarrolló un enfoque similar para la minimización unidimensional. Éste com- 
bina la lenta y confiable búsqueda de la sección dorada con la interpolación parabólica, más rápida, 
pero posiblemente no confiable. Este procedimiento intenta primero la interpolación parabólica y 
sigue aplicándola mientras se obtengan resultados aceptables. De no ser así, entonces usa la búsque- 
da de la sección dorada para poner el asunto en orden. 

La figura 13.7 presenta el pseudocódigo para el algoritmo basado en un archivo M de MATLAB 
desarrollado por Cleve Moler (2005). Éste representa una versión reducida a su mínima expresión 
de la función fminbna, que es la función profesional de minimización que se utiliza en MATLAB. 
Por esta razón, se llama la versión simplificada fminsimp. Observe que necesita otra función f que 
mantiene la ecuación para la cual se está evaluando el mínimo. 

Esto concluye el estudio de métodos para resolver los óptimos de las funciones de una sola va- 
riable. Algunos conceptos de ingeniería se presentan en el capítulo 16. Además, las técnicas aquí 
descritas son un importante elemento de algunos procedimientos para optimizar funciones con va- 
riables múltiples, como se explica en el capítulo 14. 
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PROBLEMAS 


13.1 Dada la fórmula 
fo) == +8x-12 
a) Determine en forma analítica (esto es, por medio de derivación) 
el valor máximo y el correspondiente de x para esta función. 
b) Verifique que la ecuación (13.7) produce los mismos resultados 


con base en los valores iniciales de x, = 0, x, =2 y x,= 6. 

13.2 Dada la función 
fo) =-1.5-2x* + 12x 

a) Grafique la función. 

b) Utilice métodos analíticos para probar que la función es cóncava 
para todos los valores de x. 

c) Derive la función y después use algún método de localización 
de raíces para resolver cuál es el máximo f(x) y el valor corres- 
pondiente de x. 

13.3 Encuentre el valor de x que maximiza f(x) en el problema 13.2 

con el uso de la búsqueda de la sección dorada. Emplee valores ini- 

ciales de x,= 0 y x, = 2 y realice tres iteraciones. 

13.4 Repita el problema 13.3, pero use la interpolación parabólica 

del mismo modo que en el ejemplo 13.2. Use valores iniciales x, = 

0, x,=1 y x,= 2, y realice tres iteraciones. 

13.5 Repita el problema 13.3 pero use el método de Newton. Utilice 

un valor inicial de x, = 2 y lleve a cabo tres iteraciones. 

13.6 Emplee los métodos siguientes para encontrar el máximo de 
fo) = 4x- 1.8 + 1.2 0,31% 

a) Búsqueda de la sección dorada (x, = 2, x, = 4, €, = 1%). 

b) Interpolación parabólica (xy = 1.75, x, =2, x,= 2.5, Iteraciones 
= 4). Seleccione nuevos puntos secuencialmente como en el 
método de la secante. 

c) Método de Newton (xy = 3, e, = 1%). 

13.7 Considere la función siguiente: 
fo) =*-2 -8x*-5x 

Use los métodos analítico y gráfico para demostrar que la función 
tiene un máximo para algún valor de x en el rango 2=x=<l. 

13.8 Emplee los métodos siguientes para encontrar el máximo de la 

función del problema 13.7: 

a) Búsqueda de la sección dorada (x, =-2, x, = 1, €,=1%). 

b) Interpolación parabólica (xy =-2, x, =-—1, x,= 1, iteraciones = 4). 
Seleccione nuevos puntos secuencialmente como en el método 
de la secante. 

c) Método de Newton (x, = —1, e, = 1%). 

13.9 Considere la función siguiente: 


FA)=2x+ ES 
x 


Realice 10 iteraciones de interpolación parabólica para ubicar el 
mínimo. Seleccione nuevos puntos del mismo modo que en el ejem- 
plo 13.2. Comente sobre la convergencia de sus resultados (x,= 0.1, 
x, =0.5, x,= 5). 

13.10 Considere la función que sigue: 


fo)=3+6x+5 +30 + 41* 


Localice el mínimo por medio de encontrar la raíz de la derivada de 
dicha función. Utilice el método de bisección con valores iniciales 
de x,=-2 y x, = 1. 

13.11 Determine el mínimo de la función del problema 13.10 con 
los métodos siguientes: 

a) Método de Newton (x, = —1, e, = 1%). 
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b) Método de Newton, pero con el uso de una aproximación en 
diferencias finitas para las estimaciones de las derivadas: 


_ f(x, +0x,)— f(x, — Óx,) 
Ñ 20x, 


9x,)-2 f(x) F0, 
(Sx,) 


donde d = fracción de perturbación (= 0.01). Use un valor inicial de 
Xo =—1 y haga iteraciones hasta que e, = 1%. 

13.12 Desarrolle un programa con el empleo de un lenguaje de 
programación o de macros, para implantar el algoritmo de la búsque- 
da de la sección dorada. Diseñe el programa expresamente para que 
localice un máximo. La subrutina debe tener las características si- 
guientes: 


Po) 


FO Óx,) 


FU)= 


»  Iterar hasta que el error relativo esté por debajo de un criterio 
de detención o exceda un número máximo de iteraciones. 

+  Darlos valores óptimos tanto de x como de f(x). 

+  Minimice el número de evaluaciones de la función. 


Pruebe su programa con el mismo problema del ejemplo 13.1. 
13.13 Desarrolle un programa como el que se describe en el proble- 
ma 13.12, pero haga que ejecute una minimización o una maximiza- 
ción en función de la preferencia del usuario. 

13.14 Desarrolle un programa usando un lenguaje de programación 
o macro para implementar el algoritmo de interpolación parabólica. 
Diseñe el programa de modo que esté expresamente creado para 
ubicar un máximo, y seleccione nuevos puntos como en el ejemplo 
13.2. La subrutina debe tener las siguientes características: 


+ Estar basada en dos valores iniciales, y hacer que el programa 
genere el tercer valor inicial en el punto medio del intervalo. 

+ Comprobar si los dos valores iniciales comprenden un máximo. 
Si no fuera así, la subrutina no debe ejecutar el algoritmo, sino 
enviar un mensaje de error. 

»  Iterar hasta que el error relativo esté por debajo de un criterio de 
terminación o exceda un número máximo de iteraciones. 

+  Darlos valores óptimos tanto de x como de f(x). 

+ Minimizar el número de evaluaciones de la función. 


Pruebe su programa con el mismo problema del ejemplo 13.2. 
13.15 Desarrolle un programa por medio de un lenguaje de progra- 
mación o de macros para implantar el método de Newton. La subru- 
tina debe tener las características siguientes: 


»  Iterar hasta que el error relativo esté por debajo de un criterio 
de terminación o supere un número máximo de iteraciones. 
+ Obtener los valores óptimos tanto de x como de f(x). 


Pruebe su programa con el mismo problema del ejemplo 13.3. 
13.16 En ciertos puntos detrás de un aeroplano se hacen mediciones 
de la presión. Los datos tienen el mejor ajuste con la curva y = 6 cos 
x — 1.5 sen x, desde x = O hasta 6 s. Utilice cuatro iteraciones del 
método de la búsqueda de la sección dorada para encontrar la presión 
mínima. Elija x,=2 y x, =4. 

13.17 La trayectoria de una pelota se calcula por medio de la ecuación 


2 


= (tan 0, )x —- ——22— x 
y=l 0) 2v¿ cos” 0, 


+) 


donde y = altura (m), 0, = ángulo inicial (radianes), v, = velocidad 
inicial (m/s), g = constante gravitacional = 9.81 m/s? y y, = altura 


inicial (m). Use el método de la búsqueda de la sección dorada para 
determinar la altura máxima dado que y, = 1 m, v, = 25 m/s y 0, = 
50”. Haga iteraciones hasta que el error aproximado esté por debajo 
de e, = 1%, con el uso de valores iniciales de x, =0 y x, = 60 m. 
13.18 La deflexión de una trabe uniforme sujeta a una carga con 
distribución creciente en forma lineal, se calcula con 


e 6 
> 120EIL 
Dado que L= 600 em, E= 50000 kN/em?, /= 30000 cm! y w,=2.5 
kN/cm, determine el punto de deflexión máximo con los métodos a) 
gráfico, b) de la búsqueda de la sección dorada hasta que el error 
aproximado esté por debajo de e, = 1% con valores iniciales de x, = 0 
y Xx, =L. 

13.19 Desde la superficie de la Tierra, se lanza hacia arriba un ob- 
jeto con masa de 100 kg a una velocidad de 50 m/s. Si el objeto está 
sujeto a un arrastre lineal (c = 15 kg/s), use el método de la búsque- 
da de la sección dorada para determinar la altura máxima que alcan- 
za el objeto. Sugerencia: Repase la sección PT4.1.2. 

13.20 La distribución normal es una curva con forma de campana 
definida por la ecuación 


Ex+2L2x Lx) 


y=e” 


Utilice el método de la búsqueda de la sección dorada para determi- 
nar la ubicación del punto de deflexión de esta curva para un valor 
positivo de x. 

13.21 Un objeto se puede proyectar hacia arriba a una velocidad 
específica. Si está sujeto a arrastre lineal, su altura como función del 
tiempo se puede calcular como 


m a 
z=9 += (vo + 5) (1 — ec /mo) — a 
Cc Cc Cc 
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donde z = altura (m) sobre la superficie terrestre (definida como 
z=0), zy = altura inicial (m), m = masa (kg), c = coeficiente lineal 
de arrastre (kg/s), v, = velocidad inicial, m/s y £ = tiempo (s). 
Observe que, para esta formulación, la velocidad positiva se con- 
sidera en dirección ascendente. Dados los siguientes valores de 
parámetros: g = 9.81 m/s?, z, = 100 m, v,= 55 m/s, m=80 kg y 
c = 15 kg/s, se puede usar la ecuación para calcular la altura del 
saltador. Determine el tiempo y la altura de la elevación máxima 
a) gráficamente, b) analíticamente, c) con la búsqueda de la sección 
dorada hasta que el error caiga debajo e, = 1% con valores inicia- 
les det,=0y1,=10s. 

13.22 Use la búsqueda de sección dorada para determinar la longitud 
de la escalera más corta que llegue del suelo sobre la cerca para al- 
canzar la pared del edificio (figura P13.22). Pruébela para el caso en 
el queh=d=4m. 


Figura P13.22 
Escalera reclinada contra una reja que apenas toca la pared. 


Figura 14.1 

La forma más fácil de 
visualizar las búsque- 
das en dos dimensio- 
nes es en el contexto 
del ascenso de una 
montaña (maximiza- 
ción) o del descenso a 


un valle (minimización). 


a) Mapa topográfico 
bidimensional (2-D) de 
la montaña que co- 
rresponde a la gráfica 
tridimensional (3-D) 
de la montaña en el 
inciso b). 


Optimización multidimensional 
sin restricciones 


Este capítulo describe las técnicas para encontrar el mínimo o el máximo de una función en varias 
variables. Recuerde que en el capítulo 13 nuestra imagen visual de una búsqueda unidimensional fue 
como una montaña rusa. En el caso de dos dimensiones, la imagen es como de montañas y valles 
(figura 14.1). Para problemas de más dimensiones, no es posible implementar imágenes. 

Se ha optado por limitar este capítulo al caso de dos dimensiones. Esto se debe a que las carac- 
terísticas esenciales de las búsquedas multidimensionales se comunican mejor de forma visual. 

Las técnicas para la optimización multidimensional sin restricciones se clasifican de varias 
formas. Para propósitos del presente análisis, se dividirán dependiendo de si se requiere la evaluación 
de la derivada. Los procedimientos que no requieren dicha evaluación se llaman métodos sin gra- 
diente o directos. Aquellos que requieren derivadas se conocen como métodos de gradientes o mé- 
todos de descenso (o ascenso). 


14.1 MÉTODOS DIRECTOS 

Estos métodos van desde procedimientos muy burdos hasta técnicas más elegantes que intentan 
aprovechar la naturaleza de la función. Se empezará el análisis con un método burdo. 

14.1.1 Búsqueda aleatoria 


Un simple ejemplo de los métodos burdos es el método de la búsqueda aleatoria. Como su nom- 
bre lo indica, dicho método evalúa en forma repetida la función con los valores seleccionados 
aleatoriamente de la variable independiente. Si el método se lleva a cabo con un número suficiente 
de muestras, el óptimo eventualmente se localizará. 


Líneas de figual a una constante 


mud 


a) b) 


EJEMPLO 14.1 Método de la búsqueda aleatoria 


Planteamiento del problema Utilice un generador de nú- 
meros aleatorios para localizar el máximo de 


f(x, y) =y-x-21 -2xy- y? (El4.1.1) 


en el dominio acotado por x=-2 a2, y y = l a 3. El dominio se 
muestra en la figura 14.2. Observe que un solo máximo de 1.5 se 
encuentra en x=-1 y y = 1.5. 


Solución Porlo común, los generadores de números aleatorios 
proporcionan valores entre O y 1. Si se designa a tal número como 
r, la siguiente fórmula se usa para generar valores de x aleatorios 
en un rango entre x;, y X,,: 


Xx=X,+ (%, — Xp)r 
En el presente ejemplo, x, = 2 y x, = 2, y la fórmula es 


x=-2 + (2 — (-2))r = 2 + 4r 


Esto se prueba al sustituir O y 1 para obtener -2 y 2, respectiva- 
mente. 
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0 
ENE 
2 =1 


Máximo 


Figura 14.2 
Ecuación (E14.1.1) que muestra el máximo en x=-1 y 
y =1.5. 


De manera similar para y, una fórmula para el mismo ejemplo se desarrolla como 


y=y+0,-y9r=1+(3-Dr=1+2r 


El siguiente macrocódigo VBA de Excel utiliza la función número aleatorio Rnd de VBA, para 
generar un par de valores (x, y) que se sustituyen en la ecuación (E.14.1.1). El valor máximo obteni- 
do en estos ensayos aleatorios se guarda en la variable maxf, y los valores correspondientes de x y y 


en maxx y maxy, respectivamente. 


maxf = -1E9 
For j=1Ton 
Xx -2 + 4 * Rnd 
y=13+28* Rnd 
En = Y =X == 2 *xXDPD2ZLE=2*X*Y-y 
If fn > maxf Then 


Il 


maxf = fn 
Maxx = X 
Mmaxy = y 
End If 
Next Jj 


Después de varias iteraciones se obtiene 


Iteraciones x y f(x, y) 
1000 -0.9886 1.4282 1.2462 
2000 1.0040 4724 .2490 
3000 1.0040 .4724 .2490 
4000 1.0040 .4724 .2490 
5000 1.0040 1.4724 1.2490 
6000 -0.9837 1.4936 1.2496 
7000 -0.9960 1.5079 1.2498 
8000 0.9960 .5079 .2498 
9000 0.9960 .5079 .2498 

10000 0.9978 .5039 .2500 


Los resultados indican que la técnica permite encontrar rápidamente el máximo verdadero. 
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Este simple procedimiento burdo funciona aun en discontinuidades y funciones no diferenciables. 
Además, siempre encuentra el óptimo global más que el local. Su principal deficiencia es que con- 
forme crece el número de variables independientes, la implementación requerida llega a ser costosa. 
Además, no es eficiente, ya que no toma en cuenta el comportamiento de la función. Los procedi- 
mientos siguientes descritos en este capítulo sí toman en cuenta el comportamiento de la función, 
así como los resultados de las iteraciones previas para mejorar la velocidad de la convergencia. En 
consecuencia, aunque la búsqueda aleatoria puede probar ser útil en un contexto de problemas es- 
pecífico, los siguientes métodos tienen una utilidad más general y casi siempre tienen la ventaja de 
lograr una convergencia más eficiente. 

Debemos hacer notar que se dispone de técnicas de búsqueda más sofisticadas. Éstas constitu- 
yen procedimientos heurísticos que fueron desarrollados para resolver problemas no lineales y/o 
discontinuos, que la optimización clásica usualmente no maneja bien. La simulación del templado 
de materiales, la búsqueda tabú, las redes neuronales artificiales y los algoritmos genéticos son unos 

pocos ejemplos. El más ampliamente utilizado es el algoritmo 
genético, en un número considerable de paquetes comerciales. En 
Holland (1975), iniciador del procedimiento del algoritmo gené- 
tico, y Davis (1991) y Goldberg (1989) se encuentra un buen re- 
paso de la teoría y la aplicación del método. 


14.1.2 Búsquedas univariables 
y búsquedas patrón 


SN Es muy agradable tener un procedimiento de optimización eficien- 
te que no requiera evaluar las derivadas. El método de búsqueda 

aleatoria, previamente descrito, no requiere la evaluación de la de- 

8 1 rivada, pero no es muy eficiente. En esta sección se describe un 
procedimiento, el método de búsqueda univariable, que es más 


Figura 14.3 


Descripción gráfica de cómo se presenta una búsqueda 


univariable. 


eficiente y además no requiere la evaluación de la derivada. 

La estrategia básica del método de búsqueda univariable 
consiste en trabajar sólo con una variable a la vez, para mejorar 
la aproximación, mientras las otras se mantienen constantes. 
Puesto que únicamente cambia una variable, el problema se re- 
duce a una secuencia de búsquedas en una dimensión, que se 
resuelven con una diversidad de métodos (dentro de ellos, los 
descritos en el capítulo 13). 

Realicemos una búsqueda univariable por medio de una grá- 
fica, como se muestra en la figura 14.3. Se comienza en el punto 
1, y se mueve a lo largo del eje x con y constante hacia el máximo 
en el punto 2. Se puede ver que el punto 2 es un máximo, al ob- 
servar que la trayectoria a lo largo del eje x toca justo una línea 
de contorno en ese punto. Luego, muévase a lo largo del eje y con 
x constante hacia el punto 3. Continúa este proceso generándose 
los puntos 4, 5, 6, etcétera. 

Aunque se está moviendo en forma gradual hacia el máximo, 
la búsqueda comienza a ser menos eficiente al moverse a lo largo 
AS 2 de una cresta angosta hacia el máximo. Sin embargo, también 

observe que las líneas unen puntos alternados como 1-3, 3-5 o 2-4, 
4-6 que van en la dirección general del máximo. Esas trayectorias 
presentan una oportunidad para llegar directamente a lo largo de 
la cresta hacia el máximo. Dichas trayectorias se denominan di- 


=Y 


Figura 14.4 
Direcciones conjugadas. 


Eo recciones patrón. 

Hay algoritmos formales que capitalizan la idea de las direc- 
ciones patrón para encontrar los valores óptimos de manera efi- 
ciente. El más conocido de tales algoritmos es el método de Powell, 
el cual se basa en la observación (véase la figura 14.4) de que si 


14.2 Métodos con gradiente 


los puntos 1 y 2 se obtienen por búsquedas en una dimensión en 
la misma dirección, pero con diferentes puntos de partida, enton- 
ces la línea formada por 1 y 2 estará dirigida hacia el máximo. 
Tales líneas se llaman direcciones conjugadas. 

En efecto, se puede demostrar que si f(x, y) es una función 
cuadrática, las búsquedas secuenciales a lo largo de las direccio- 
nes conjugadas convergerán exactamente en un número finito de 
pasos, sin importar el punto de partida. Puesto que una función 
no lineal a menudo llega a ser razonablemente aproximada por 
una función cuadrática, los métodos basados en direcciones con- 
jugadas son, por lo común, bastante eficientes y de hecho son 
convergentes en forma cuadrática conforme se aproximan al óp- 
timo. 
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Se implementará en forma gráfica una versión simplificada 
del método de Powell para encontrar el máximo de 


2 2 

ia o IS Figura 14.5 
donde a, b y c son constantes positivas. Esta ecuación representa Método de Powell. 
contornos circulares en el plano x, y, como se muestra en la figu- 
ra 14,5. 

Se inicia la búsqueda en el punto cero con las direcciones 
iniciales h, y h,. Observe que h, y h, no son necesariamente di- 
recciones conjugadas. Desde cero, se mueve a lo largo de la dirección h, hasta un máximo que se 
localiza en el punto 1. Después se busca el punto 1 a lo largo de la dirección h, para encontrar el 
punto 2. Luego, se forma una nueva dirección de búsqueda h, a través de los puntos O y 2. Se busca 
a lo largo de esta dirección hasta que se localice el máximo en el punto 3. Después la búsqueda va 
del punto tres en la dirección h, hasta que se localice el máximo en el punto 4. Del punto 4 se llega 
al punto 5, buscando de nuevo hz. Ahora, observe que ambos puntos, 5 y 3, se han localizado por 
búsqueda en la dirección hz, desde dos puntos diferentes. Powell ha demostrado que h, (formado por 
los puntos 3 y 5) y h; son direcciones conjugadas. Así, buscando desde el punto 5 a lo largo de ha, 
nos llevará directamente al máximo. 

El método de Powell se puede refinar para volverse más eficiente; pero los algoritmos formales 
van más allá del alcance de este texto. Sin embargo, es un método eficiente que converge en forma 
cuadrática sin requerir evaluación de la derivada. 


14.2 MÉTODOS CON GRADIENTE 


Como su nombre lo indica, los métodos con gradiente utilizan en forma explícita información de la 
derivada para generar algoritmos eficientes que localicen el óptimo. Antes de describir los procedi- 
mientos específicos, primero se repasarán algunos conceptos y operaciones matemáticos clave. 


14.2.1 Gradientes y hessianos 


Recuerde del cálculo que la primera derivada de una función unidimensional proporciona la pen- 
diente de la recta tangente a la función que se analiza. Desde el punto de vista de la optimización, 
ésta es una información útil. Por ejemplo, si la pendiente es positiva, nos indica que al incrementar 
el valor de la variable independiente nos conducirá a un valor más alto de la función que se está 
analizando. 

Del cálculo, también recuerde que la primera derivada puede indicarnos cuándo se ha encon- 
trado un valor óptimo, puesto que éste es el punto donde la derivada toma el valor de cero. Además, 
el signo de la segunda derivada puede indicarnos si se ha alcanzado un mínimo (positivo en la 
segunda derivada) o un máximo (negativo en la segunda derivada). 

Esas ideas fueron útiles en los algoritmos de búsqueda en una dimensión que se estudiaron en 
el capítulo anterior. No obstante, para entender por completo las búsquedas multidimensionales, se 
debe primero entender cómo se expresan la primera y la segunda derivada en un contexto multidi- 
mensional. 
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E 


Figura 14.6 


El gradiente direccional se define a lo largo de un eje h que 


forma un ángulo 6 con el eje x. 


El gradiente Suponga que se tiene una función en dos dimen- 
siones f(x, y). Un ejemplo podría ser su altura sobre una montaña 
como una función de su posición. Suponga que usted está en un 
lugar específico sobre la montaña (a, b) y quiere conocer la pen- 
diente en una dirección arbitraria. Una forma de definir la direc- 
ción es a lo largo de un nuevo eje h que forma un ángulo 6 con el 
eje x (figura 14.6). La elevación a lo largo de un nuevo eje puede 
entenderse como una nueva función g(h). Si usted define su po- 
sición como el origen de este eje (es decir, h = 0), la pendiente en 
esta dirección podría designarse como g”(0). Esta pendiente, que 
se llama derivada direccional, se puede calcular a partir de las 
derivadas parciales a lo largo de los ejes x y y mediante 


g(0)= yN cos 9+L sen O (14.1) 
Ox lo) 


y 
donde las derivadas parciales son evaluadas en x= a y y = b. 
Suponiendo que su objetivo es obtener la mayor elevación con 
el siguiente paso, ahora la pregunta lógica sería: ¿en qué dirección 
está el mayor paso de ascenso? La respuesta a esta pregunta es 
proporcionada mediante lo que matemáticamente se conoce como 
el gradiente, el cual se define así: 


(14.2) 


Este vector también se conoce como “nabla f”, el cual se relaciona con la derivada direccional de 


f(x, y) en el punto x=a y y =b. 


La notación vectorial ofrece un medio conciso para generalizar el gradiente a n dimensiones, 


Vf(x)= 


af 


ox, 


(x) 


¿Cómo se usa el gradiente? Para el problema de subir la montaña, si lo que interesa es ganar 
elevación tan rápidamente como sea posible, el gradiente nos indica, de manera local, qué dirección 
tomar y cuánto ganaremos al hacerlo. Observe, sin embargo, que dicha estrategia ¡no necesariamente 
nos lleva en una trayectoria directa a la cima! Más tarde, en este capítulo, se analizarán estas ideas 


con mayor profundidad. 


EJEMPLO 14.2 Utilización del gradiente para evaluar la trayectoria de máxima 


pendiente 


Planteamiento del problema Con el gradiente evalúe la dirección de máxima pendiente para 


la función 


Fx, y) =xy 


en el punto (2, 2). Se considera que la x positiva está dirigida hacia el este y la y positiva hacia el norte. 
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Solución Primero, la elevación se determina así 


02,2) =20)=8 


Ahora, se evalúan las derivadas parciales, 


of 2 de 
Y 12-94 143 
Ox id E 


af. 2xy=22)0)=8 


dy E 


ll, 


las cuales se usan para determinar el gradiente como 
Vf = 41 + 8j ae 
Este vector puede bosquejarse en un mapa topográfico de la fun- 


ción, como en la figura 14.7. Esto inmediatamente nos indica que i 
la dirección que debe tomarse es 0 0 2 3 E 


Pp 
- 


a 8Y_ : m a 
0 = tan . =1.107 radianes (= 63.4) Figura 14.7 


La flecha sigue la dirección del ascenso de mayor pendien- 
respecto al eje x. La pendiente en esta dirección, que es la magnitud — te calculado con el gradiente. 
de Vf, se calcula así 


/4? +8? =8.944 


Así, durante el primer paso, inicialmente se ha ganado 8.944 unidades de aumento de elevación por 
unidad de distancia recorrida a lo largo de esta trayectoria con la mayor pendiente. Observe que la 
ecuación (14.1) da el mismo resultado, 


g'(0) = 4 cos(1.107) + 8 sen(1.107) = 8.944 


Observe que para cualquier otra dirección, digamos 0 = 1.107/2 = 0.5235, g"(0) = 4 cos (0.5235) + 8 
sen (0.5235) = 7.608, que es menor. 

Conforme se mueve hacia adelante, cambiarán tanto la dirección como la magnitud de la tra- 
yectoria de mayor pendiente. Estos cambios se pueden cuantificar a cada paso mediante el gradien- 
te y la dirección del ascenso se modificará de acuerdo con ello. 

Se puede obtener una mejor comprensión al inspeccionar la figura 14.7. Como se indica, la di- 
rección de ascenso con mayor pendiente es perpendicular, u ortogonal, al contorno en la elevación 
en la coordenada (2, 2). Ésta es una propiedad del gradiente. 


Además de definir la trayectoria de mayor pendiente, también se utiliza la primera derivada para 
determinar si se ha alcanzado un óptimo. Como en el caso para una función de una dimensión, si 
las derivadas parciales con respecto a x y y son cero, se ha alcanzado el óptimo en dos dimensiones. 


El hessiano En problemas de una dimensión, tanto la primera como la segunda derivada ofrecen 
información valiosa en la búsqueda del óptimo. La primera derivada a) proporciona una trayectoria 
de máxima inclinación de la función y b) indica que se ha alcanzado el óptimo. Una vez en el óptimo, 
la segunda derivada indicará si es un máximo [ f(x) negativo] o un mínimo [ f”(x) positivo]. En los 
párrafos anteriores, se ilustró cómo el gradiente proporciona la mejor trayectoria en problemas mul- 
tidimensionales. Ahora, se examinará cómo se usa la segunda derivada en este contexto. 

Puede esperarse que si las segundas derivadas parciales respecto de x y y son negativas ambas, 
entonces se ha alcanzado un máximo. La figura 14.8 muestra una función en la que esto no es cier- 
to. El punto (a, b) de esta gráfica parece ser un mínimo cuando se observa a lo largo ya sea de la 
dimensión x o de la y. En ambos casos, las segundas derivadas parciales son positivas. Sin embargo, 
si la función se observa a lo largo de la línea y = x, puede verse que se presenta un máximo en el 
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mismo punto. Éste se conoce como punto silla y, claramente, no 
se presentan ni un máximo ni un mínimo en ese punto. 

Ya sea que ocurra un máximo o un mínimo, esto involucra 
no sólo a las primeras derivadas parciales con respecto a x y y, 
sino también a la segunda derivada parcial respecto a x y y. Su- 
poniendo que las derivadas parciales sean continuas en y cerca 
del punto que se habrá de evaluar, se puede calcular la siguiente 
cantidad: 


LL (IN 
2 2 
dx” dy Oxdy 


(14.3) 


Pueden presentarse tres casos: 


» Si|H] > 0 y 07f/0x? > 0, entonces f(x, y) tiene un mínimo 


local. 
» Si|A] > 0 y 0f/dx? < O, entonces f(x, y) tiene un máximo 
local. 
Figura 14.8 » Si|A] <0, ento.nces f(x, y) tiene un punto silla. 
Un punto silla (x= a y y = b). Observe que al ser vista la 
curva a lo largo de las direcciones x y y, parece que la fun- La cantidad |A] es igual al determinante de una matriz for- 


ción pasa por un mínimo (la segunda derivada es positiva); mada con las segundas derivadas,' 
. y pS > 
mientras que al verse a lo largo del eje x= y, es cóncava 


hacia abajo (la segunda derivada es negativa). *f *f 
de dxdy 

=15 14.4 

HS ys ey id 
dydx dy” 


donde a esta matriz se le conoce formalmente como el hessiano de f. 

Además de proporcionar un medio para discriminar si una función multidimensional ha alcan- 
zado el óptimo, el hessiano tiene otros usos en optimización (por ejemplo, en la forma multidimen- 
sional del método de Newton). En particular, permite búsquedas que incluyen curvatura de segundo 
orden para obtener mejores resultados. 


Aproximaciones por diferencias finitas Se debe mencionar que en los casos donde es difícil 
o inconveniente calcular analíticamente tanto el gradiente como el determinante hessiano, éstos se 
pueden evaluar numéricamente. En la mayoría de los casos se emplea el método que se presentó 
en la sección 6.3.3 para el método de la secante modificado. Es decir, las variables independientes se 
modifican ligeramente para generar las derivadas parciales requeridas. Por ejemplo, si se adopta el 
procedimiento de diferencias centrales, éstas se calculan así 


df _f(x+Óx, y)- (1 Óx,y) 


dx 20x (14.5) 
df _ f(x, y+0y)- f(x, y-0y) (14.6) 
dy 20y a 
f_fG+Óx, y)-2f(x, y) + f(x Óx, y) 

y (14,7) 


dx? Óx? 


' Observe que 0(dx0y) = 0(dy0x). 


14.2 Métodos con gradiente 


%f_ fa, y+0y)-2f(x, y) + Fx, y -Óy) 


14.8 
of _ F(x+óx, y +0y)— f(x +óx, y —0y)— f(x dr, y +9y)+ f(x — dx, y -Óy) (14.9) 
dxdy 40xóy 


donde ó es un valor fraccional muy pequeño. 

Observe que los métodos empleados en paquetes de software comerciales también usan dife- 
rencias hacia adelante. Además, son usualmente más complicados que las aproximaciones enlistadas 
en las ecuaciones (14.5) a la (14.9). Dennis y Schnabel (1996) dan más detalles sobre este método. 

Sin importar cómo se implemente la aproximación, la cuestión importante es que se pueda tener 
la opción de evaluar el gradiente y/o el hessiano en forma analítica. Esto algunas veces puede resul- 
tar una tarea ardua; pero el comportamiento del algoritmo puede ser benéfico para que el esfuerzo 
valga la pena. Las derivadas de forma cerrada serán exactas; pero lo más importante es que se re- 
duce el número de evaluaciones de la función. Este último detalle tiene un impacto significativo en 
el tiempo de ejecución. 

Por otro lado, usted practicará con frecuencia la opción de calcular estas cantidades internamen- 
te mediante procedimientos numéricos. En muchos casos, el comportamiento será el adecuado y se 
evitará el problema de numerosas derivaciones parciales. Tal podría ser el caso de los optimizadores 
utilizados en ciertas hojas de cálculo y paquetes de software matemático (por ejemplo, Excel). En 
dichos casos, quizá no se le dé la opción de introducir un gradiente y un hessiano derivados en for- 
ma analítica. Sin embargo, para problemas de tamaño pequeño o moderado esto no representa un 
gran inconveniente. 


14.2.2 Método de máxima inclinación 


Una estrategia obvia para subir una colina sería determinar la pendiente máxima en la posición 
inicial y después comenzar a caminar en esa dirección. Pero claramente surge otro problema casi de 
inmediato. A menos que usted realmente tenga suerte y empiece sobre una cuesta que apunte direc- 
tamente a la cima, tan pronto como se mueva su camino diverge en la dirección de ascenso con 
máxima inclinación. 

Al darse cuenta de este hecho, usted podría adoptar la siguiente estrategia. Avance una distan- 
cia corta a lo largo de la dirección del gradiente. Luego deténgase, reevalúe el gradiente y camine 
otra distancia corta. Mediante la repetición de este proceso podrá 
llegar a la punta de la colina. 

Aunque tal estrategia parece ser superficialmente buena, no 
es muy práctica. En particular, la evaluación continua del gradien- 
te demanda mucho tiempo en términos de cálculo. Se prefiere un 
método que consista en moverse por un camino fijo, a lo largo del 
gradiente inicial hasta que f(x, y) deje de aumentar; es decir, 
tienda a nivelarse en su dirección de viaje. Este punto se convier- 
te en el punto inicial donde se reevalúa Vf y se sigue una nueva 
dirección. El proceso se repite hasta que se alcance la cima. Este 
procedimiento se conoce como método de máxima inclinación? 
Es la más directa de las técnicas de búsqueda con gradiente. La 
idea básica detrás del procedimiento se describe en la figura 14.9. 


AN 
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Debido a nuestro énfasis sobre maximización, aquí se utiliza la terminología de 
ascenso de máxima inclinación. El mismo enfoque se puede utilizar también para 


Figura 14.9 


la minimización; en este caso se usará la terminología de descenso de máxima Descripción gráfica del método de máxima inclinación. 


inclinación. 
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Vf=3i + 4j 


Figura 14.10 
Relación entre una dirección arbitraria h y las coordenadas 


xy y. 


foil 
x 
of 

= =h 
y E 


Comenzaremos en un punto inicial (xy, yo) etiquetado como 
“0” en la figura. En este punto, se determina la dirección de ascen- 
so con máxima inclinación; es decir, el gradiente. Entonces se 
busca a lo largo de la dirección del gradiente, A, hasta que se en- 
cuentra un máximo, que se marca como “1” en la figura. Después 
el proceso se repite. 

Así, el problema se divide en dos partes: 1) se determina la 
“mejor” dirección para la búsqueda y 2) se determina “el mejor 
valor” a lo largo de esa dirección de búsqueda. Como se verá, la 
efectividad de los diversos algoritmos descritos en las siguientes 
páginas depende de qué tan hábiles seamos en ambas partes. 

Por ahora, el método del ascenso con máxima inclinación usa 
el gradiente como su elección para la “mejor” dirección. Se ha 
mostrado ya cómo se evalúa el gradiente en el ejemplo 14.1. Aho- 
ra, antes de examinar cómo se construye el algoritmo para loca- 
lizar el máximo a lo largo de la dirección de máxima inclinación, 
se debe hacer una pausa para explorar el modo de transformar una 
función de x y y en una función de h a lo largo de la dirección del 
gradiente. 

Comenzando en xy y yo las coordenadas de cualquier punto 
en la dirección del gradiente se expresan como 


(14.10) 


(14.11) 


donde h es la distancia a lo largo del eje h. Por ejemplo, suponga que x, = 1, y, =2 y Vf'= 31 + 4j, 
como se muestra en la figura 14.10. Las coordenadas de cualquier punto a lo largo del eje h están 


dadas por 
x=1+3hn 
y =2 + 4h 


(14.12) 
(14.13) 


El siguiente ejemplo ilustra la forma en que se emplean tales transformaciones para convertir una 


función bidimensional de x y y en 


EJEMPLO 14.3 Desarrollo de 


Planteamiento del problema 


(x, y) =2xy + 2x - 1? - 2y? 
) ) y 


una función unidimensional de h. 


una función 1-D a lo largo de la dirección del gradiente 


Suponga que se tiene la siguiente función en dos dimensiones: 


Desarrolle una versión unidimensional de esta ecuación a lo largo de la dirección del gradiente en 


el punto donde x=-1 y y=1. 


Solución Las derivadas parciales se evalúan en (-1, D), 


of 


Y —2y+2-2x=20)+2-2U-D)=6 
Ox 


of 


6 


=2x-4y=221)-4(1)= 
dy 


Por lo tanto, el vector gradiente es 


Vf= 6i - 6j 


14.2 Métodos con gradiente 


Para encontrar el máximo, se busca en la dirección del gradiente; es decir, a lo largo de un eje h que 
corre en la dirección de este vector. La función se expresa a lo largo de este eje como 


sir ¿Eno Ln Js 1+6h,1-6h) 
Ox dy 


=2(-1+6M(1-6h)+2(-1+6h) - (-1+6h) -2(1-6hy 


donde las derivadas parciales se evalúan enx=-1 y y=1. 
Al combinar términos, se obtiene una función unidimensional g(h) que transforma f(x, y) a lo 
largo del eje h, 


g(h) =-180/? + 72h -7 


Ahora que se ha obtenido una función a lo largo de la trayectoria de ascenso de máxima incli- 
nación, es posible explorar cómo contestar la segunda pregunta. Esto es, ¿qué tan lejos se llega a lo 
largo de este camino? Un procedimiento sería moverse a lo largo de este camino hasta encontrar el 
máximo de la función. Identificaremos la localización de este máximo como h*. Éste es el valor 
del paso que maximiza g (y, por lo tanto, f) en la dirección del gradiente. Este problema es equiva- 
lente a encontrar el máximo de una función de una sola variable h. Lo cual se realiza mediante di- 
ferentes técnicas de búsqueda unidimensional como las analizadas en el capítulo 13. Así, se pasa de 
encontrar el óptimo de una función de dos dimensiones a realizar una búsqueda unidimensional a 
lo largo de la dirección del gradiente. 

Este método se llama ascenso de máxima inclinación cuando se utiliza un tamaño de paso ar- 
bitrario h. Si se encuentra que un valor de un solo paso h* nos lleva directamente al máximo a lo 
largo de la dirección del gradiente, el método se llama ascenso óptimo de máxima inclinación. 


EJEMPLO 14.4 Ascenso óptimo de máxima inclinación 


Planteamiento del problema Maximice la siguiente función: 
FG, y) =2xy + 2x1 2y? 
usando los valores iniciales, x=-1 y y =1. 


Solución Debido a que esta función es muy simple, se obtiene primero una solución analítica. Para 
hacerlo, se evalúan las derivadas parciales 


$ 2y+2 2x=0 
xx 

o 
dy 


De este par de ecuaciones se puede encontrar el valor óptimo, en x=2 y y = 1. Las segundas deri- 
vadas parciales también se determinan y evalúan en el óptimo, 


of 


dx? 


Y Y 
dxdy dydx 


y el determinante de la matriz hessiana se calcula [ecuación (14.3)], 


|H| =-2(4) -2=4 
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Por lo tanto, debido a que la | > 0 y 9f/0x? < 0, el valor de la función f(2, 1) es un máximo. 

Ahora se usará el método del ascenso de máxima inclinación. Recuerde que al final del ejemplo 
14.3 ya se habían realizado los pasos iniciales del problema al generar 

g(h) =-180h? + 72h -7 
Ahora, ya que ésta es una simple parábola, se puede localizar, de manera directa, el máximo (es 
decir, h = h*) resolviendo el problema, 

g(H*) =0 

-360h* +72=0 

h* =0.2 
Esto significa que si se viaja a lo largo del eje h, g(h) alcanza un valor mínimo cuando h = h* =0.2. 
Este resultado se sustituye en las ecuaciones (14.10) y (14.11) para obtener las coordenadas (x, y) 
correspondientes a este punto, 

x=-1 + 6(0.2) = 0.2 

y = 1 -6(0.2) = -0.2 
Este paso se describe en la figura 14.11 conforme el movimiento va del punto 0 al 1. 


El segundo paso se implementa tan sólo al repetir el procedimiento. Primero, las derivadas 
parciales se evalúan en el nuevo punto inicial (0.2, —0.2) para obtener 


% 202)+2-202)=12 
Ox 

202) -4(-0.2)=12 
dy 


Por lo tanto, el vector gradiente es 
Vf= 1.2i + 1.2] 


Esto significa que la dirección de máxima inclinación está ahora dirigida hacia arriba y hacia la 
derecha en un ángulo de 45? con el eje x (véase la figura 14.11). Las coordenadas a lo largo de este 
nuevo eje h se expresan ahora como 


x=0.2+1.2h 
y=-0.2+1.2h 


Al sustituir estos valores en la función se obtiene 
F(0.2 + 1.2h, -0.2 + 1.2h) = g(h) = -1.44h? + 2.88h + 0.2 


El paso h* que nos lleva al máximo a lo largo de la dirección 
marcada ahora se calcula directamente como 

ge (H*) =-2.88h* + 2.88 =0 

h*=1 


Este resultado se sustituye en las ecuaciones (14.10) y (14.11) para 
obtener las coordenadas (x, y) correspondientes a este nuevo punto, 


x=0.2+120)=14 
y=-02+1.2(1)=1 


ii ñ IA, Como se describe en la figura 14.11, nos movemos a las nuevas 
y 2 0 2 4 Sl S coordenadas, marcadas como punto 2 en la gráfica, y al hacer esto 


nos acercamos al máximo. El procedimiento se puede repetir y 
se obtiene un resultado final que converge a la solución analítica, 
x=2yy=1. 


Figura 14.11 
El método del ascenso óptimo de máxima inclinación. 


14.2 Métodos con gradiente 


Es posible demostrar que el método del descenso de máxima inclinación es linealmente conver- 
gente. Además, tiende a moverse de manera muy lenta, a lo largo de crestas largas y angostas. Esto 
porque el nuevo gradiente en cada punto máximo será perpendicular a la dirección original. Así, la 
técnica da muchos pasos pequeños cruzando la ruta directa hacia la cima. Por lo tanto, aunque es 
confiable, existen otros métodos que convergen mucho más rápido, particularmente en la vecindad 
de un valor óptimo. En el resto de la sección se examinan esos métodos. 


14.2.3 Métodos avanzados del gradiente 


Método de gradientes conjugados (Fletcher-Reeves) En la sección 14.1.2 se ha visto cómo 
en el método de Powell las direcciones conjugadas mejoran mucho la eficiencia de la búsqueda 
univariable. De manera similar, se puede también mejorar el ascenso de máxima inclinación lineal- 
mente convergente usando gradientes conjugados. En efecto, se puede demostrar que un método de 
optimización, que usa gradientes conjugados para definir la dirección de búsqueda, es cuadrática- 
mente convergente. Esto también asegura que el método optimizará una función cuadrática exacta- 
mente en un número finito de pasos sin importar el punto de inicio. Puesto que la mayoría de las 
funciones que tienen buen comportamiento llegan a aproximarse en forma razonable bien mediante 
una función cuadrática en la vecindad de un óptimo, los métodos de convergencia cuadrática a me- 
nudo resultan muy eficientes cerca de un valor óptimo. 

Se ha visto cómo, empezando con dos direcciones de búsqueda arbitrarias, el método de Powell 
produce nuevas direcciones de búsqueda conjugadas. Este método es cuadráticamente convergente y 
no requiere la información del gradiente. Por otro lado, si la evaluación de las derivadas es práctica, 
se pueden buscar algoritmos que combinen las ideas del descenso de máxima inclinación con las 
direcciones conjugadas, para lograr un comportamiento inicial más sólido y de convergencia rápida 
conforme la técnica conduzca hacia el óptimo. El algoritmo del gradiente conjugado de Fletcher- 
Reeves modifica el método de ascenso de máxima inclinación al imponer la condición de que suce- 
sivas direcciones de búsqueda del gradiente sean mutuamente conjugadas. La prueba y el algoritmo 
están más allá del alcance del texto, pero se describen en Rao (1996). 


Método de Newton El método de Newton para una sola variable (recuerde la sección 13.3) se 
puede extender a los casos multivariables. Escriba una serie de Taylor de segundo orden para f(x) 
cerca de X =X,, 
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1 
Fx) SF) AVI A) )+ 7 x)"H (XX) 
donde H, es la matriz hessiana. En el mínimo, 


f(x) _ 
OX e 


para ¡=1, 2,...,n 
Así, 

Vf = VA(x,) + H(x—x,)=0 
Si H es no singular, 


Xx. =xX,-H Vf (14.14) 


la cual, se puede demostrar, converge en forma cuadrática cerca 
del óptimo. Este método, de nuevo, se comporta mejor que el mé- y1 
todo del ascenso de máxima inclinación (véase la figura 14.12). 

Sin embargo, observe que este método requiere tanto del cálculo Figura 14.12 


de las segundas derivadas como de la inversión matricial, en cada Cuando el punto inicial está cerca del punto óptimo, seguir 


iteración. Por lo que el método no es muy útil en la práctica para el gradiente puede resultar ineficiente. Los métodos de 


funciones con gran número de variables. Además, el método de Newton intentan la búsqueda a lo largo de una trayectoria 


Newton quizá no converja si el punto inicial no está cerca del óp- directa hacia el óptimo (línea continua). 


timo. 
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PROBLEMAS 


14.1 Encuentre la derivada direccional de 


FG, y) =4+2y 
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Método de Marquardt Se sabe que el método del ascenso de máxima inclinación aumenta el 
valor de la función, aun si el punto inicial está lejos del óptimo. Por otro lado, ya se describió el mé- 
todo de Newton, que converge con rapidez cerca del máximo. El método de Marquardt usa el méto- 
do del descenso de máxima inclinación cuando x está lejos de x*, y el método de Newton cuando x 
está cerca de un óptimo. Esto se puede lograr al modificar la diagonal del hessiano en la ecuación 
(14.14), 


H,=H,+0,1 


donde dx, es una constante positiva e / es la matriz identidad. Al inicio del procedimiento, se supone 
que «a, es grande y 
BH = En 
0; 
la cual reduce la ecuación (14.14) al método del ascenso de máxima inclinación. Conforme conti- 
núan las iteraciones, dr, se aproxima a cero y el método se convierte en el de Newton. 

Así, el método de Marquardt ofrece lo mejor de los procedimientos: comienza en forma con- 
fiable a partir de valores iniciales pobres y luego acelera en forma rápida cuando se aproxima al 
óptimo. Por desgracia, el método también requiere la evaluación del hessiano y la inversión matricial 
en cada paso. Debe observarse que el método de Marquardt es, ante todo, útil para problemas no 
lineales de mínimos cuadrados. 


Métodos de cuasi-Newton Los métodos cuasi-Newton, o métodos de métrica variable, buscan 
estimar el camino directo hacia el óptimo en forma similar al método de Newton. Sin embargo, 
observe que la matriz hessiana en la ecuación (14.14) se compone de las segundas derivadas de f que 
varían en cada paso. Los métodos cuasi-Newton intentan evitar estas dificultades al aproximar H 
con otra matriz A, sólo las primeras derivadas parciales de f. El procedimiento consiste en comen- 
zar con una aproximación inicial de 4” y actualizarla y mejorarla en cada iteración. Estos métodos 
se llaman de cuasi-Newton porque no usan el hessiano verdadero, sino más bien una aproximación. 
Así, se tienen dos aproximaciones simultáneas: 1) la aproximación original de la serie de Taylor y 
2) la aproximación del hessiano. 

Hay dos métodos principales de este tipo: los algoritmos de Davidon-Fletcher-Powell (DEP) y 
de Broyden-Fletcher-Goldfarb-Shanno (BFGS). Éstos son similares excepto en detalles concernien- 
tes a cómo manejan los errores de redondeo y su convergencia. BFGS es, por lo general, reconocido 
como superior en la mayoría de los casos. Rao (1996) proporciona detalles y declaraciones formales 
sobre ambos algoritmos, el DFP y el BFGS. 


b) Haga una gráfica de los resultados del inciso a), en la que se 
muestre la trayectoria de la búsqueda. 

14.5 Encuentre el vector gradiente y la matriz hessiana para cada 

una de las funciones siguientes: 


six=2 y y =2, en la dirección de h = 21 + 3). 
14.2 Repita el ejemplo 14.2 para la función siguiente, en el punto 
(0.8, 1.2). 


f(x, y) =2xy + 1.5y- 1.25 -2y?+5 
14.3 Dada 
f(x, y) =2.25xy + 1.75y — 1.5 -2y” 


construya y resuelva un sistema de ecuaciones algebraicas lineales 
que maximice f(x). Observe que esto se logra por medio de igualar a 
cero las derivadas parciales de fcon respecto tanto de x como de y. 
14.4 a) Comience con un valor inicial de x= 1 y y = 1, y realice 
dos aplicaciones del método de ascenso de máxima inclinación para 
f(x, y), como en el problema 14.3. 


a) fa y= 2xy? +36" 

b) Fa, y, Z=*+yY+22 

c) f(x, y) =1nGé + 2xy + 3y?) 

14.6 Encuentre el valor mínimo de 
FG y) = (4-3) + G-2y 


comience conx= 1 y y= 1, utilice el método de descenso de máxima 
inclinación con un criterio de detención de e, = 1%. Explique sus 
resultados. 

14.7 Efectúe una iteración del método de ascenso de máxima incli- 
nación para localizar el máximo de 


FG, y) =6.4x + 2y +10 2x* + 2xy -— 3y” 


con los valores iniciales de x = 0 y y = 0. Emplee bisección para 
encontrar el tamaño óptimo de paso en la dirección de búsqueda del 
gradiente. 

14.8 Realice una iteración del método de descenso de máxima incli- 
nación del gradiente óptimo, para localizar el mínimo de 


FG, y) =-8x +12 + 12y + 4y?-2xy 


utilice valores iniciales de x=0 y y =0. 
14.9 Con un lenguaje de programación o de macros, desarrolle un 
programa para implantar el método de búsqueda aleatoria. Diseñe el 
subprograma de modo que en forma expresa localice un máximo. 
Pruebe el programa con f(x, y) del problema 14.7. Utilice un rango 
de -2 a 2 tanto para x como para y. 
14.10 La búsqueda por malla es otro procedimiento burdo para op- 
timizar. En la figura P14.10 se ilustra la versión para dos dimensiones. 
Las dimensiones x y y se dividen en incrementos a fin de formar una 
malla. Después, se evalúa la función en cada nodo de la malla. Entre 
más densa sea la malla más probable será la localización del óptimo. 
Con un lenguaje de programación o de macros, desarrolle un 
programa para implantar el método de búsqueda por malla. Diseñe 
el programa expresamente para que localice un máximo. Pruébelo 
con el mismo problema del ejemplo 14.1. 
14.11 Desarrolle una ecuación unidimensional en la dirección del 
gradiente de presión en el punto (4, 2). La función de presión es 


KA, y) = 6 y - 9y?- 8x? 
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14.12 Una función de temperatura es 
Ay =2y —-Txy-x2+ 3y 


Desarrolle una función unidimensional en la dirección del gradiente 
de temperatura en el punto (1, 1). 


UN 
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Figura P14.10 
La búsqueda por malla. 


Optimización con restricciones 


Este capítulo aborda problemas de optimización en los cuales entran en juego restricciones. Prime- 
ro, se analizarán problemas donde la función objetivo y las restricciones son lineales. Para tales 
casos, hay métodos especiales que aprovechan la linealidad de las funciones, llamados métodos de 
programación lineal. Los algoritmos resultantes resuelven con gran eficiencia problemas muy gran- 
des con miles de variables y restricciones. Dichos métodos se utilizan en una gran variedad de 
problemas en ingeniería y en administración. 

Después, se verá en forma breve el problema más general de optimización con restricciones no 
lineal. Finalmente, se proporcionará una visión general de cómo se emplean los paquetes de software 
en la optimización. 


15.1 PROGRAMACIÓN LINEAL 


La programación lineal (o PL, por simplicidad) es un método de optimización que se ocupa del 
cumplimiento de un determinado objetivo, como maximizar las utilidades o minimizar el costo, en 
presencia de restricciones como recursos limitados. El término lineal denota que las funciones ma- 
temáticas que representan el objetivo y las restricciones son lineales. El término programación no 
significa “programación en computadora”; más bien denota “programar” o “fijar una agenda” (Re- 
velle y colaboradores, 1997). 


15.1.1 Forma estándar 


El problema básico de la programación lineal consiste en dos partes principales: la función objetivo 
y un conjunto de restricciones. En un problema de maximización, la función objetivo, por lo general, 
se expresa como 


Maximizar Z=C,X, + C,X,+-:**+C,X, (15.1) 


donde c,= la contribución de cada unidad de la j-ésima actividad realizada y x, = magnitud de la 
j-ésima actividad. Así, el valor de la función objetivo, Z, es la contribución total debida al número 
total de actividades, n. 

Las restricciones se representan, en forma general, como 


AX + ApX) + +++ 0 5X, < b; (15.2) 


donde a, = cantidad del ¡-ésimo recurso que se consume por cada unidad de la j-ésima actividad, y 
b,= cantidad del ¿-ésimo recurso que está disponible. Es decir, los recursos son limitados. 

El segundo tipo general de restricción, especifica que todas las actividades deben tener un valor 
positivo: 


x,>0 (15.3) 


En el presente contexto, lo anterior expresa la noción realista de que, en algunos problemas, la acti- 
vidad negativa es físicamente imposible (por ejemplo, no se pueden producir bienes negativos). 

Juntas, la función objetivo y las restricciones, especifican el problema de programación lineal. 
Éstas indican que se trata de maximizar la contribución de varias actividades, bajo la restricción de 
que en estas actividades se utilizan cantidades finitas de recursos. Antes de mostrar cómo se pue- 
de obtener este resultado, primero se desarrollará un ejemplo. 


15.1 Programación lineal 


EJEMPLO 15.1 Planteamiento del problema de la PL 


Planteamiento del problema Se desarrolla el siguiente problema del área de la ingeniería 
química o petrolera. Aunque, éste es relevante para todas las áreas de la ingeniería relacionadas con 
la generación de productos con recursos limitados. 

Suponga que una planta procesadora de gas recibe cada semana una cantidad fija de materia 
prima. Esta última se procesa para dar dos tipos de gas: calidad regular y prémium. Estas clases de 
gas son de gran demanda (es decir, se tiene garantizada su venta) y dan diferentes utilidades a la 
compañía. Sin embargo, su producción involucra restricciones de tiempo y de almacenamiento. Por 
ejemplo, no se pueden producir las dos clases a la vez, y las instalaciones están disponibles solamen- 
te 80 horas por semana. Además, existe un límite de almacenamiento para cada uno de los productos. 
Todos estos factores se enlistan abajo (observe que una tonelada métrica, o ton, es igual a 1000 kg): 


Producto 
Recurso Regular Prémium Disponibilidad del recurso 
Materia prima 7 m/ton 11 m%/ton 77 m*/semana 
Tiempo de producción 10 h/ton 8 h/ton 80 h/semana 
Almacenamiento 9 ton 6 ton 
Ganancia 150/ton 175/ton 


Desarrolle una formulación de programación lineal para maximizar las utilidades de esta operación. 


Solución El ingeniero que opera esta planta debe decidir la cantidad a producir de cada tipo de 
gas para maximizar las utilidades. Si las cantidades producidas cada semana de gas regular y pré- 
mium se designan como x, y x,, respectivamente, la ganancia total se calcula mediante 


Ganancia total = 150x, + 173x, 
o se escribe como una función objetivo en programación lineal: 
Maximizar Z= 150x, + 175x, 


Las restricciones se desarrollan en una forma similar. Por ejemplo, el total de gas crudo (mate- 
ria prima) utilizado se calcula como: 


Total de gas utilizado =7x, + 11x, 


Este total no puede exceder el abastecimiento disponible de 77 m*/semana, así que la restricción se 
representa como 


Tx, + 11x,577 


Las restricciones restantes se desarrollan en una forma similar: la formulación completa resul- 
tante de PL está dada por 


Maximizar Z= 150x, + 175x, (maximizar la ganancia) 

sujeta a 
Tx + 11x,5 77 (restricciones de material) 
10x, + 8x, < 80 (restricción de tiempo) 
x¡<9 (restricción de almacenaje de gas “regular”) 
x%6 (restricción de almacenaje de gas “prémium”) 
xp x,20 (restricciones positivas) 


Observe que el conjunto de ecuaciones anterior constituye la formulación completa de PL. Las expli- 
caciones en los paréntesis de la derecha se han incluido para aclarar el significado de cada expresión. 
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15.1.2 Solución gráfica 


Debido a que las soluciones gráficas están limitadas a dos o tres dimensiones, tienen una utilidad 
práctica limitada. Sin embargo, son muy útiles para demostrar algunos conceptos básicos de las técni- 
cas algebraicas generales, utilizadas para resolver problemas multidimensiones en la computadora. 

En un problema bidimensional, como el del ejemplo 15.1, el espacio solución se define como un 
plano con x, medida a lo largo de la abscisa; y x,, a lo largo de la ordenada. Como las restricciones 
son lineales, se trazan sobre este plano como líneas rectas. Si el problema de PL se formuló adecua- 
damente (es decir, si tiene una solución), estas líneas restrictivas describen una región, llamada el 
espacio de solución factible, que abarca todas las posibles combinaciones de x, y x,, las cuales obe- 
decen las restricciones y, por lo tanto, representan soluciones factibles. La función objetivo de un 
valor particular de Z se puede trazar como otra línea recta y sobreponerse en este espacio. El valor 
de Z, entonces, se ajusta hasta que esté en el valor máximo, y toque aún el espacio factible. Este 
valor de Z representa la solución óptima. Los valores correspondientes de x, y x,, donde Z toca el 
espacio de solución factible, representan los valores óptimos de las actividades. El siguiente ejemplo 
deberá ayudar a aclarar el procedimiento. 


EJEMPLO 15.2 Solución gráfica 


Planteamiento del problema Desarrolle una solución gráfica para el problema del procesa- 
miento de gas del ejemplo 15.1: 


Maximizar Z= 150x, + 175x, 


sujeta a 
Tx, + 11x,< 77 0) 
10x, + 8x, < 80 2) 
x 9 6) 
x%6 (4) 
1>0 (5) 
x>0 (6) 


Se numeraron las restricciones para identificarlas en la siguiente solución gráfica. 


Solución Primero, se trazan las restricciones sobre el espacio solución. Por ejemplo, se reformu- 
la la primera restricción como una línea al reemplazar la desigualdad por un signo igual, y se des- 


peja x,: 
Xx =- 0 +7 


Así, como en la figura 15.1a, los valores posibles de x, y x, que obedecen dicha restricción se hallan 
por debajo de esta línea (en la gráfica, la dirección se indica con la pequeña flecha). Las otras res- 
tricciones se evalúan en forma similar, se sobreponen en la figura 15.1a. Observe cómo éstas encie- 
rran una región donde todas se satisfacen. Éste es el espacio solución factible (el área ABCDE en la 
gráfica). 

Además de definir el espacio factible, la figura 15.1a también ofrece una mejor comprensión. 
En particular, se percibe que la restricción 3 (almacenamiento de gas regular) es “redundante”. Es 
decir, el espacio solución factible no resulta afectado si fuese suprimida. 

Después, se agrega la función objetivo a la gráfica. Para hacerlo, se debe escoger un valor de Z. 
Por ejemplo, para Z= 0, la función objetivo es ahora 


0 = 150x, + 175x, 


o, despejando x,, se obtiene la línea recta 
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XI 


Redundante 


Xx 


a) 


Figura 15.1 

Solución gráfica de un problema de programación lineal. a) Las restricciones definen un espacio solu- 
ción factible. b) La función objetivo se incrementa hasta que alcance el valor máximo que cumpla con 
todas las restricciones. Gráficamente, se mueve hacia arriba y a la derecha, hasta que toca el espacio 
factible en un solo punto óptimo. 


Como se muestra en la figura 15.1b, ésta representa una línea punteada que interseca el origen. 
Ahora, debido a que estamos interesados en maximizar Z, ésta se aumenta a, digamos, 600, y la 
función objetivo es 


600 150 
X= IZ GTA 

175 175 
Así, al incrementar el valor de la función objetivo, la línea se aleja del origen. Como la línea todavía 
cae dentro del espacio solución, nuestro resultado es aún factible. No obstante, por la misma razón, 
todavía hay espacio para mejorarlo. Por lo tanto, Z continúa aumentando hasta que un incremento 
adicional lleve la función objetivo más allá de la región factible. Como se muestra en la figura 15.15, 
el valor máximo de Z corresponde aproximadamente a 1400. En este punto, x, y x, son, de manera 
aproximada, iguales a 4.9 y 3.9, respectivamente. Así, la solución gráfica indica que si se producen estas 
cantidades de gas regular y prémium, se alcanzará una máxima utilidad de aproximadamente 1 400. 


Además de determinar los valores óptimos, el procedimiento gráfico ofrece una mejor com- 
prensión del problema. Esto se aprecia al sustituir de nuevo las soluciones en las ecuaciones res- 
trictivas: 


7(4.9) + 11(3.9) = 77 
10(4.9) + 8(3.9) = 80 
49<9 
3.9<6 


En consecuencia, como se ve claramente en la gráfica, producir la cantidad óptima de cada pro- 
ducto nos lleva directamente al punto donde se satisfacen las restricciones de los recursos (1) y del 
tiempo (2). Tales restricciones se dice que son obligatorias. Además, la gráfica también hace 
evidente que ninguna de las restricciones de almacenamiento [(3) ni (4)] actúan como una limi- 
tante. Tales restricciones se conocen como no obligatorias. Esto nos lleva a la conclusión práctica 
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de que, en este caso, se pueden aumentar las utilidades, ya sea con un incremento en el abasteci- 
miento de recursos (el gas crudo) o en tiempo de producción. Además, esto indica que el aumento 
del almacenamiento podría no tener impacto sobre las utilidades. 

El resultado obtenido en el ejemplo anterior es uno de los cuatro posibles resultados que, por lo 
general, se obtienen en un problema de programación lineal. Éstos son: 


1. Solución única. Como en el ejemplo, la función objetivo máxima interseca un solo punto. 

2. Soluciones alternativas. Suponga que los coeficientes de la función objetivo del ejemplo fueran 
paralelos precisamente a una de las restricciones. En nuestro ejemplo, una forma en la cual esto 
podría ocurrir sería que las utilidades se modificaran a $140/ton y $220/ton. Entonces, en lugar 
de un solo punto, el problema podría tener un número infinito de óptimos correspondientes a un 
segmento de línea (véase figura 15.2a). 


Figura 15.2 

Además de una sola solución óptima (por ejemplo, la figura 15.16), existen otros tres resultados posi- 
bles en un problema de programación lineal: a) óptima alternativa, b) solución no factible y c) un resul- 
tado no acotado. 


3. Solución no factible. Como en la figura 15.2b, es posible que el problema esté formulado de 
tal manera que no haya una solución factible. Esto puede deberse a que se trata de un problema 
sin solución o a errores en la formulación del problema. Lo último ocurre si el problema está 
sobrerrestringido, y ninguna solución satisface todas las restricciones. 

4. Problemas no acotados. Como en la figura 15.2c, esto usualmente significa que el problema está 
subrestringido y, por lo tanto, tiene límites abiertos. Como en el caso de la solución no factible, 
esto a menudo ocurre debido a errores cometidos durante la especificación del problema. 


Ahora supongamos que nuestro problema tiene una solución única. El procedimiento gráfico 
podría sugerir una estrategia numérica para dar con el máximo. Observando la figura 15.1, deberá 
quedar claro que siempre se presenta el óptimo en uno de los puntos esquina, donde se presentan 
dos restricciones. Tales puntos se conocen de manera formal como puntos extremos. Así, del núme- 
ro infinito de posibilidades en el espacio de decisión, al enfocarse en los puntos extremos, se reducen 
claramente las opciones posibles. 

Además, es posible reconocer que no todo punto extremo es factible; es decir, satisface todas 
las restricciones. Por ejemplo, observe que el punto F en la figura 15.1a es un punto extremo; pero 
no es factible. Limitándonos a puntos extremos factibles, se reduce todavía más el campo factible. 

Por último, una vez que se han identificado todos los puntos extremos factibles, el que ofrezca 
el mejor valor de la función objetivo representará la solución óptima. Se podría encontrar esta solu- 
ción óptima mediante la exhaustiva (e ineficiente) evaluación del valor de la función objetivo en cada 
punto extremo factible. En la siguiente sección se analiza el método simplex, que ofrece una mejor 
estrategia para trazar un rumbo selectivo, a través de una secuencia de puntos extremos factibles, 
para llegar al óptimo de una manera extremadamente eficiente. 


15.1 Programación lineal 


15.1.3 El método simplex 


El método simplex se basa en la suposición de que la solución óptima estará en un punto extremo. Así, 
el procedimiento debe ser capaz de discriminar si durante la solución del problema se presentará un 
punto extremo. Para esto, las ecuaciones con restricciones se reformulan como igualdades, introdu- 
ciendo las llamadas variables de holgura. 


Variables de holgura Como lo indica su nombre, una variable de holgura mide cuánto de un 
recurso restringido está disponible; es decir, cuánta “holgura” está disponible. Por ejemplo, recuerde 
el recurso restringido que se utilizó en los ejemplos 15.1 y 15.2: 


Tx + 11x,< 77 


Se define una variable de holgura S, como la cantidad de gas crudo que no se usa para un nivel de 
producción específico (x;, x,). Si esta cantidad se suma al lado izquierdo de la restricción, esto vuel- 
ve exacta a la relación: 


7x, + Mx, +8,=77 


Ahora vemos qué nos dice la variable de holgura. Si es positiva, significa que se tiene algo de 
“holgura” en esta restricción. Es decir, se cuenta con un excedente de recurso que no se está utili- 
zando por completo. Si es negativa, nos indica que hemos sobrepasado la restricción. Finalmente, si 
es cero, denota que la restricción se satisface con precisión. Es decir, hemos utilizado todo el recur- 
so disponible. Puesto que ésta es exactamente la condición donde las líneas de restricción se inter- 
secan, la variable de holgura ofrece un medio para detectar los puntos extremos. 

Una variable de holgura diferente se desarrolla para cada ecuación restringida, lo cual resulta 
en lo que se conoce como la versión aumentada completamente, 


Maximizar Z= 150x, + 175x, 


sujeta a 
Tx, +11x,+6, =77 (15.4a) 
10x, + 8x, +58, =80 (15.4b) 
Hi +5, =9 (15.4c) 


de +S4=6 (15.4d) 
X1» X2, Si, S», Sa, Sa 2 0 


Advierta cómo se han establecido las cuatro ecuaciones, de manera que las incógnitas quedan 
alineadas en columnas. Se hizo así para resaltar que ahora se trata de un sistema de ecuaciones al- 
gebraicas lineales (recuerde la parte tres). En la siguiente sección se mostrará cómo se emplean 
dichas ecuaciones para determinar los puntos extremos en forma algebraica. 


Solución algebraica A diferencia de la parte tres, donde se tenían n ecuaciones con n incógni- 
tas, nuestro sistema del ejemplo [ecuaciones (15.4)] está subespecificado o indeterminado; es decir, 
tiene más incógnitas que ecuaciones. En términos generales, hay n variables estructurales (las 
incógnitas originales), m variables de holgura o excedentes (una por restricción) y n+m variables en 
total (estructurales más excedentes). En el problema de la producción de gas se tienen 2 variables 
estructurales, 4 variables de holgura y 6 variables en total. Así, el problema consiste en resolver 
4 ecuaciones con 6 incógnitas. 

La diferencia entre el número de incógnitas y el de ecuaciones (igual a 2 en nuestro problema) 
está directamente relacionada con la forma en que se distingue un punto extremo factible. Específi- 
camente, cada punto factible tiene 2 de las 6 variables igualadas a cero. Por ejemplo, los cinco 
puntos en las esquinas del área ABCDE tienen los siguientes valores cero: 
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E 7] 


Punto extremo Variables cero 


X1% 
Xas S2 
S, S, 
Si Sa 
X1, Sa 


moOnaw» 


Esta observación nos lleva a concluir que los puntos extremos se determinan a partir de la forma 
estándar igualando dos de las variables a cero. En nuestro ejemplo, esto reduce el problema a resol- 
ver 4 ecuaciones con 4 incógnitas. Por ejemplo, para el punto £, si x, = S¿ = 0, la forma estándar se 


reduce a 
11x, +8, =77 
8x, +58, =80 
+5,=9 
Xx, =6 


de donde se obtiene x, = 6, S, = 11, S, = 32 y S, = 9. Junto con x, = S, = 0, estos valores definen el 
punto £. 

Generalizando, una solución básica de m ecuaciones lineales con n incógnitas se obtiene al 
igualar a cero las variables n — m y resolver las m ecuaciones para las m incógnitas restantes. Las 
variables igualadas a cero se conocen formalmente como variables no básicas; mientras que a 
las m variables restantes se les llama variables básicas. Si todas las variables básicas son no nega- 
tivas, al resultado se le llama una solución factible básica. El óptimo será una de éstas. 

Ahora, un procedimiento directo para determinar la solución óptima será calcular todas las 
soluciones básicas, determinar cuáles de ellas son factibles, y de éstas, cuál tiene el valor mayor de 
Z. Sin embargo, éste no es un procedimiento recomendable por dos razones. 

Primero, aun para problemas de tamaño moderado, se necesita resolver una gran cantidad 
de ecuaciones. Para m ecuaciones con n incógnitas, se tendrán que resolver 


n! 


" — mG=m)! 
ecuaciones simultáneas. Por ejemplo, si hay 10 ecuaciones (m = 10) con 16 incógnitas (n = 16), ¡se 
tendrían 8008 [= 16!/(10!6!)] sistemas de ecuaciones de 10 x 10 para resolver! 

Segundo, quizás una porción significativa de éstas no sea factible. Por ejemplo, en el problema 
actual de los C¿= 15 puntos extremos, sólo 5 son factibles. Claramente, si se pudiese evitar resolver 
todos estos sistemas innecesarios, se tendría un algoritmo más eficiente. Uno de estos procedimien- 
tos se describe a continuación. 


Implementación del método simplex El método simplex evita las ineficiencias descritas en 
la sección anterior. Esto se hace al comenzar con una solución factible básica. Luego se mueve a 
través de una secuencia de otras soluciones factibles básicas que mejoran sucesivamente el valor de 
la función objetivo. En forma eventual, se alcanza el valor óptimo y se termina el método. 

Se ilustrará el procedimiento con el problema de procesamiento de gas, de los ejemplos 15.1 y 
15.2. El primer paso consiste en empezar en una solución factible básica (es decir, en un punto 
esquina extremo del espacio factible). Para casos como los nuestros, un punto de inicio obvio podría 
ser el punto A; esto es, x, = x,= 0. Las 6 ecuaciones originales en 4 incógnitas se convierten en 


5: =77 
5 =80 
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Así, los valores iniciales de las variables básicas se dan automáticamente y son iguales a los lados 
derecho de las restricciones. 

Antes de proceder al siguiente paso, la información inicial se puede resumir en un adecuado 
formato tabular. Como se muestra a continuación, la tabla proporciona un resumen de la información 
clave que constituye el problema de la programación lineal. 


Básica 


z X X S; S, S3 Sa Solución  Intersección 
Ze 1 -150 175 0 0 0 0 0 
S; 0 7 11 1 0 0 0 17 11 
S3 0 10 8 0 1 0 0 80 8 
S3 0 1 0 0 0 1 0 9 9 
Sa 0 0 1 0 0 0 1 6 co 


Observe que para propósitos de la tabla, la función objetivo se expresa como 


Z-150x,- 175x,- 05, -—08,-—0S,-0S,=0 (15.5) 


El siguiente paso consiste en moverse a una nueva solución factible básica que nos lleve a me- 
jorar la función objetivo. Esto se consigue incrementando una variable actual no básica (en este 
punto, x, O x,) por arriba de cero para que Z aumente. Recuerde que, en el ejemplo presente, los 
puntos extremos deben tener 2 valores cero. Por lo tanto, una de las variables básicas actuales (S,, 
S», $3 0 S¿) también deben igualarse a cero. 

Para resumir este paso importante: una de las variables no básicas actuales debe hacerse básica 
(no cero). Esta variable se llama variable de entrada. En el proceso, una de las variables básicas 
actuales se vuelve no básica (cero). Esta variable se llama variable de salida. 

Ahora, desarrollaremos un procedimiento matemático para seleccionar las variables de entrada 
y de salida. A causa de la convención de cómo escribir la función objetivo [ecuación (15.5)], la va- 
riable de entrada puede ser cualquier variable de la función objetivo que tenga un coeficiente nega- 
tivo (ya que esto hará a Z más grande). La variable con el valor negativo más grande se elige de 
manera convencional porque usualmente nos lleva al incremento mayor en Z. En nuestro caso, x, será 
la variable entrante puesto que su coeficiente, —175, es más negativo que el coeficiente de x,: -150. 

Aquí se puede consultar la solución gráfica para mejor com- 
prensión. Se comienza en el punto inicial A, como se muestra en 
la figura 15.3. Considerando su coeficiente, se escogerá x, como 
entrada. No obstante, para abreviar en este ejemplo, seleccionamos Ir 
x¡ puesto que en la gráfica se observa que nos llevará más rápido 
al máximo. 

Después, se debe elegir la variable de salida entre las variables 
básicas actuales (S,, S,, $3 0 S¿). Se observa gráficamente que hay 
dos posibilidades. Moviéndonos al punto B se tendrá S, igual a 


cero; mientras que al movernos al punto F tendremos S, igual 
a cero. Sin embargo, en la gráfica también queda claro que F no 
es posible, ya que queda fuera del espacio solución factible. Así, 
decide moverse de A a B. 

¿Cómo se detecta el mismo resultado en forma matemática? 
Una manera es calcular los valores en los que las líneas de res- 
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tricción intersecan el eje o la línea que corresponde a la variable 
saliente (en nuestro caso, el eje x,). Es posible calcular este valor 
como la razón del lado derecho de la restricción (la columna 
“Solución” de la tabla) entre el coeficiente correspondiente de x;. 
Por ejemplo, para la primera variable de holgura restrictiva S,, el Figura 15.3 


resultado es Ilustración gráfica de cómo se mueve en forma sucesiva 
el método simplex a través de soluciones básicas factibles, 


77 11 para llegar al óptimo de manera eficiente. 


Intersección = > = 
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Las intersecciones restantes se pueden calcular y enlistar como la última columna de la tabla. De- 
bido a que 8 es la menor intersección positiva, significa que la segunda línea de restricción se alcan- 
zará primero conforme se incremente x,. Por lo tanto, 5, será la variable de entrada. 

De esta manera, nos hemos movido al punto B (x, = S,= 0), y la nueva solución básica es ahora 


Tx, +8, =77 

10x, =80 

Xi + 8, =9 
Si =6 


La solución de este sistema de ecuaciones define efectivamente los valores de las variables básicas 
en el punto B: x, =8,S,=21,S,=1yS,¿=6. 

Se utiliza la tabla para realizar los mismos cálculos empleando el método de Gauss-Jordan. 
Recuerde que la estrategia básica de este método implica convertir el elemento pivote en 1, y después 
eliminar los coeficientes en la misma columna arriba y abajo del elemento pivote (recuerde la sección 
9.7). 

En este ejemplo, el renglón pivote es S, (la variable de entrada) y el elemento pivote es 10 (el 
coeficiente de la variable de salida, x,). Al dividir el renglón entre 10 y reemplazar S, por x, se tiene 


Básica z X X S; S» S3 Sa Solución — Intersección 
Z; 1 -150 175 0 0 0 0 0 
S, 0 7 11 1 0 0 0 77 
X 0 1 0.8 0 0.1 0 0 8 
S3 0 1 0 0 0 1 0 9 
Sa 0 0 1 0 0 0 1 6 


Después, se eliminan los coeficientes de x, en los otros renglones. Por ejemplo, para el renglón 
de la función objetivo, el renglón pivote se multiplica por -150 y el resultado se resta del primer 
renglón para obtener 


Z X Xx S; S, S;3 Sa Solución 
1 -150 -175 0 0 0 0 0 

=0 -(-150) (120) -0 =(-15) 0 0 =(-1 200) 
1 0 =55 0 15 0 0 1200 


Es posible realizar operaciones similares en los renglones restantes para obtener la nueva tabla, 


Básica z X: X S, S, S3 Sa Solución Intersección 
Z 1 0 =55 0 15 0 0 1200 
S; 0 0 5.4 1 0.7 0 0 21 3.889 
X 0 1 0.8 0 0.1 0 0 8 10 
S3 0 0 0.8 0 0.1 1 0 1 -1.25 
Sa 0 0 1 0 0 0 1 6 6 


Así la nueva tabla resume toda la información del punto B. Esto incluye el hecho de que el mo- 
vimiento ha aumentado la función objetivo a Z= 1200. 

Esta tabla se utiliza después para representar el próximo y, en este caso, último paso. Sólo una 
variable más, x,, tiene un valor negativo en la función objetivo, y se elige, por lo tanto, como la va- 
riable de salida. De acuerdo con los valores de la intersección (ahora calculados como la columna 
solución sobre los coeficientes de la columna de x,), la primera restricción tiene el valor positivo más 
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pequeño y, por lo tanto, se selecciona S, como la variable de entrada. Así, el método simplex nos 
mueve del punto B al C en la figura 15.3. Por último, la eliminación de Gauss-Jordan se utiliza para 
resolver las ecuaciones simultáneas. El resultado es la tabla final, 


Xi X S; S» S3 Sa Solución 


Básica 


z 
Z 1 0 0 10.1852 7.8704 0 0 1413.889 
X 0 0 1 0.1852 0.1296 0 0 3.889 
X 0 1 0 0.1481 0.2037 0 0 4.889 
S3 0 0 0 0.1481 0.2037 1 0 4.111 
Sá 0 0 0 0.1852 0.1296 0 1 2.111 


Se sabe que éste es el resultado final porque no quedan coeficientes negativos en la fila de la 
función objetivo. La solución final se tabula como x, = 3.889 y x, = 4.889, que dan una función ob- 
jetivo máxima Z= 1 413.889. Además, como S; y S, están todavía en la base, sabemos que la solución 
está limitada por la primera y la segunda restricciones. 


15.2 OPTIMIZACIÓN NO LINEAL CON RESTRICCIONES 


Existen varios procedimientos para los problemas de optimización no lineal con la presencia de 
restricciones. Generalmente, dichos procedimientos se dividen en directos e indirectos (Rao, 1996). 
Los procedimientos indirectos típicos usan las llamadas funciones de penalización. Éstas consideran 
expresiones adicionales para hacer que la función objetivo sea menos óptima conforme la solución 
se aproxima a una restricción. Así, la solución no será aceptada por violar las restricciones. Aunque 
tales métodos llegan a ser útiles en algunos problemas, se vuelven difíciles cuando el problema 
tiene muchas restricciones. 

El método de búsqueda del gradiente reducido generalizado, o GRG, es uno de los métodos 
directos más populares (para detalles, véase Fylstra ef al., 1998; Lasdon et al., 1978; Lasdon y 
Smith, 1992). Éste es, de hecho, el método no lineal usado en el Solver de Excel. 

Este método primero “reduce” a un problema de optimización sin restricciones. Lo hace resol- 
viendo en un conjunto de ecuaciones no lineales las variables básicas en términos de variables no 
básicas. Después, se resuelve el problema sin restricciones utilizando procedimientos similares a los 
que se describen en el capítulo 14. Se escoge primero una dirección de búsqueda a lo largo de la cual 
se busca mejorar la función objetivo. La selección obvia es un procedimiento cuasi-Newton (BFGS) 
que, como se describió en el capítulo 14, requiere el almacenamiento de una aproximación de la 
matriz hessiana. Este procedimiento funciona muy bien en la mayoría de los casos. El procedimien- 
to del gradiente conjugado también está disponible en Excel como una alternativa para problemas 
grandes. El Solver de Excel tiene la excelente característica de que, en forma automática, cambia al 
método del gradiente conjugado, dependiendo de la capacidad de almacenamiento. Una vez estable- 
cida la dirección de búsqueda, se lleva a cabo una búsqueda unidimensional a lo largo de esa direc- 
ción, mediante un procedimiento de tamaño de paso variable. 


15.3 OPTIMIZACIÓN CON PAQUETES DE SOFTWARE 


Los paquetes de software tienen grandes capacidades para la optimización. En esta sección, se dará 
una introducción a algunos de los más útiles. 


15.3.1 Programación lineal en Excel 


Existe una variedad de paquetes de software especialmente diseñados para la programación lineal. 
Sin embargo, como su disponibilidad es amplia, este análisis se concentrará en la hoja de cálculo de 
Excel. Ésta usa la opción Solver que se estudió, previamente en el capítulo 7, para localizar raíces. 
La manera en la cual se usa Solver para programación lineal es similar a las aplicaciones hechas 
con anterioridad, en el sentido de cómo se introducen los datos en las celdas de la hoja de cálculo. 
La estrategia básica consiste en ubicar una celda que será optimizada, como una función de las va- 
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riaciones de las otras celdas sobre la misma hoja de cálculo. El siguiente ejemplo ilustra cómo rea- 
lizar esto con el problema del procesamiento de gas. 


EJEMPLO 15.3 Uso del Solver de Excel para un problema de programación lineal 


Planteamiento del problema Utilice Excel para resolver el problema del procesamiento de gas 
que examinamos en este capítulo. 


Solución Una hoja de cálculo de Excel para calcular los valores pertinentes en el problema del 
procesamiento de gas se muestra en la figura 15.4. Las celdas no sombreadas son las que contienen 
los datos numéricos y las leyendas. Las celdas sombreadas contienen las cantidades que se calculan 
basadas en las otras celdas. Reconozca que la celda que va a ser maximizada es la D12, la cual con- 
tiene la utilidad total. Las celdas que cambian son B4:C4, donde se tienen las cantidades producidas 
de gas regular y prémium. 


A B Cc 


1 | Problema para el procesamiento de gas 
— 
3 Regular Prémium Total Disponible 
4 | Producido 0 0 =B6*B4+C6*C4 
— 
6 | Materia prima 7 11 0 renos =B7*B4+C7*C4 
7 | Tiempo 10 8 0 “a” 
8 | Almacen. de gas regular 0 9 
9 | Almacen. de gas prémium 0 6 Figura 15.4 
10 =B4 Hoja de cálculo en Ex- 
11 | Ganancia por unidad 150 175 me cel para usar el Solver 
12 ¡ | | cid 
cid 8 , y =C4 con la programación 
$ lineal. 
=B4*B11 =C4*C11 =B12+C12 === 


Una vez que se crea la hoja de cálculo, se selecciona Solver del menú Tools (Herramientas). En 
este momento se despliega una ventana de diálogo solicitándole la información pertinente. Las cel- 
das del cuadro de diálogo de Solver se llenan así 


Parámetros de Solver ax 
Celda objetivo: | sosiz 
Valor de la 


celda objetivo: (” Máximo (e Mínimo (” Valores de: | 0 
Cerrar 


Cambiando las celdas: 
| $B$4:5C$4 = Estimar 


-Sujetas a las siguientes restricciones: -- Opciones... 
$B$4 >=0 Agregar... 


$0$4>=0 

$D$6 <= $E$6 Cambiar... 

$080 <= sESS o 
$D$8 <= $E$8 Eliminar == 
$D$9 <= $E$9 P- = Ayuda 


Las restricciones se agregan una por una al seleccionar el botón “Agregar”. Esto abrirá un cua- 
dro de diálogo que se ve así 


EAS 12 1x] 


Celdas referencia: Restricciones: 


[sDse =] <= [=sese 5] 


Cancelar Agregar Ayuda 
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Entonces, la restricción donde el total de materia 
prima (celda D6) debe ser menor o igual que el abas- 1 | Problema para el procesamiento de gas 
tecimiento disponible (E6) se agrega como se mues- 2| 
tra. Después de agregar cada una de las restricciones, 3| Regular Prémium Total Disponible 
puede seleccionarse el botón agregar. Cuando se hayan 4 | Producido 4.888889 | 3.888889 
introducido las cuatro restricciones, seleccionamos | 
el botón Aceptar para regresar a la ventana de diálo- 6 | Materia prima 7 11 77 77 
go del Solver. 7 | Tiempo 10 8 80 80 
Ahora, antes de la ejecución, se deberá seleccio- 8 | Almacen. de gas regular 4.888889 9 
nar el botón “Opciones...” del Solver y escoger el 9 | Almacen. de gas prémium 3.888889 6 
cuadro rotulado como “Assume linear model” (Su- | 30| 
poner modelo lineal). Esto hará que Excel emplee una | 41 | Ganancia por unidad 150 175 
versión del algoritmo simplex (en lugar del Solver no 12 | Ganancia 733.3333 680.5556 
lineal más general que normalmente usa) que acele- 
ra su aplicación. Figura 15.5 


Después de seleccionar esta opción, regrese el Hoja de cálculo de Excel con la solución al problema de programación 
menú Solver. Cuando seleccione el botón aceptar, se lineal. 
abrirá un cuadro de diálogo con un reporte sobre el 
éxito de la operación. En el caso actual, el Solver 


obtiene la solución correcta (figura 15.5). | 


Además de obtener la solución, Solver también ofrece algunos reportes en resumen útiles. Estos 
se explorarán en las aplicaciones a la ingeniería que se describen en la sección 16.2. 


15.3.2 Excel para la optimización no lineal 


La manera de usar Solver para la optimización no lineal es similar a las aplicaciones hechas con 
anterioridad en el sentido de cómo los datos se introducen en las celdas de la hoja de cálculo. Una 
vez más, la estrategia básica es tener una sola celda a optimizar, como una función de las variaciones 
en las otras celdas sobre la misma hoja de cálculo. El siguiente ejemplo ilustra cómo hacer esto con 
el problema del paracaidista que planteamos en la introducción de esta parte del libro (recuerde el 
ejemplo PT4.1). 


EJEMPLO 15.4 Uso del Solver de Excel para la optimización con restricciones no lineal 
Planteamiento del problema Recuerde que en el ejemplo PT4.1 se desarrolló una optimización 


con restricciones no lineal para minimizar el costo de la caída de un paracaídas en un campo de 
refugiados. Los parámetros de este problema son 


Parámetro Símbolo Valor Unidades 


Masa total M, 2000 kg 
Aceleración de la gravedad g 9.8 m/s? 
Coeficiente de costo (constante) Co 200 $ 
Coeficiente de costo (longitud) Ci 56 $/m 
Coeficiente de costo (área) C 0.1 $/m? 
Velocidad crítica de impacto VA 20 m/s 
Efecto del área sobre el arrastre Ko 3 kg/(s - m?) 
Altura inicial de caída Zo 500 m 


Sustituyendo estos valores en las ecuaciones (PT4.11) a (PT4.19) se obtiene 
Minimizar C =n(200 + 56£ + 0.14?) 
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sujeta a 
v<20 
n21 


donde n es un entero y todas las otras variables son reales. Además, las siguientes cantidades se 
definen como 


A=21P 
l=V/2r 
c=3A 
M 
m= =— (E15.4.1) 
n 
2 
A ES Ed ri (El5.4.2) 
Cc Cc 
V= 9.8m a NN gtelmo 


Utilice Excel para resolver este problema con las variables de diseño r y n que minimicen el costo C. 


Solución Antes de llevar este problema a Excel, se debe enfrentar primero el problema de deter- 
minar la raíz en la formulación anterior [ecuación (E15.4.2)]. Un método podría ser desarrollar un 
macro para implementar un método de localización de raíces, tal como el de la bisección o de la 
secante. (Se ilustrará cómo realizar esto en el próximo capítulo, en la sección 16.3.) 

Aunque, hay un procedimiento más fácil mediante la siguiente solución de la ecuación (E15.4.2) 
que es la iteración de punto fijo, 


2 
E pa 500 + cdi a gs Res, 
a (El5.4.3) 


C 


Así, £ se ajusta hasta que se satisfaga la ecuación (E15.4.3). Se puede mostrar que para el rango de 
los parámetros usados en este problema, la fórmula siempre converge. 

Ahora, ¿cómo se puede resolver esta ecuación en una hoja de cálculo? Como se muestra abajo, se 
fijan dos celdas para que tengan un valor de t y el lado derecho de la ecuación (E15.4.3) [es decir, (0)]. 


19 Raíz localización: 


20 t 0 


211 1(t) [ 0.480856] 


C C 9.8m 


2 
=|:0 2d 000 (I 00) Cc 


Se puede teclear la ecuación (E15.4.3) en la celda B21 de tal forma que tome el valor del tiempo en 
la celda B20 y los valores de los otros parámetros se asignan en otras celdas en cualquier otro lugar 
de la hoja (véase a continuación cómo se construye toda la hoja). Después colóquese en la celda B20 
y lleve su valor a la celda B21. 

Una vez que se introduce esta fórmula, se desplegará en forma 
inmediata el mensaje de error: “No se pueden resolver referencias 
circulares”, ya que B20 depende de B21 y viceversa. Ahora, escoja 
del menú Herramientas/Opciones y seleccione calculation (cálculos). 
Del cuadro de diálogo “cálculos”, escoja “iteración” y presione “acep- 
10 10.25595| tar”. En forma inmediata la hoja de cálculo iterará estas celdas y el 

resultado aparecerá como la figura de la izquierda. 


Raíz localización: 


19 


t 10.2551 
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Así, las celdas convergirán a la raíz. Si se quiere tener más precisión, sólo presione la tecla F9 para 
que se realicen más iteraciones (por default son 100 iteraciones, que es posible modificar si así se desea). 

En la figura 15.6 se muestra cómo implementar una hoja de cálculo en Excel para calcular 
los valores pertinentes. Las celdas no sombreadas son las que contienen los datos numéricos y las 
leyendas. Las celdas sombreadas contienen cantidades que se calculan basadas en las otras celdas. 
Por ejemplo, la masa en B17 se calculó con la ecuación (E15.4.1) con base en los valores de M, (B4) 
y n (ES). Observe también que algunas celdas son redundantes. Por ejemplo, la celda El1 se refiere 
a la celda ES. Esta repetición en la celda El1 es para que la estructura de las restricciones sea eviden- 
te en la hoja. Finalmente, note que la celda que habrá de minimizarse es E15, que contiene el costo 
total. Las celdas que cambian son E4:ES5, en las cuales se tiene el radio y el número de paracaídas. 


Pa ar C ya a Pr [ere 
1. Problema de optimización del paracaídas 
2 4 
3 | Parámetros: Variables de diseño: 
4 Mt 2000 r 1 
59 9.8 n 1 
6 | cost 200 
JETA! cost2 56 Restricciones: 
[El | cost3 0.1 
9 ve 20 variable tipo límite 
10) ko 3 v 95.8786 <= 20 
11 z0 500 n 1 >= 1 
12 
13 Valores calculados: Función objetivo: 
214 A 6.283185 
EN 1.414214 Costo 283.1438 Figura 15.6 
16 18.84956 j , 
$7 - 2000 Hoja de cálculo en Excel que 
== muestra la solución del problema 
19 Raíz localización: de optimización no lineal del 
20 t 10.26439 paracaídas. 
21. f(t) 10.26439 
Una vez que se ha creado la hoja de cálculo, se elige la so- Parámetros de Solver 1 E3 
lución Solver del menú herramientas. En esta etapa se desplegará Celda objetivo — [:5E$15 3] Resolver | 
un cuadro de diálogo, solicitándole la información pertinente. Las Valor de la máxima" Mínimo” Valores de:| 0 
E a celda objetivo. reo ESa Cerrar | 
celdas en el cuadro de diálogo de Solver se llenan como se indica Al cambiar las celdas: 
a la derecha. [SES4:5ES5 Estimar | 
Se deben agregar las restricciones una por una al seleccionar Sujetas a las siguientes restricciones: Opciones 
el botón “agregar”. Esto abrirá un cuadro de diálogo que se ve así: $E$10 <= $G$10 Agregar_| 


$E$11 >= $G$11 


n = integer Cambiar 


Celdas referencia: Restricciones: > 


[sesto 3] [<= >] [=scsio 3 
Aceptar Cancelar Agregar 


Como se muestra, la restricción de que la velocidad de impacto presente (celda E10) debe ser 
menor o igual que la velocidad requerida (G10) puede agregarse como se muestra. Después de agre- 
gar cada restricción se puede seleccionar el botón “agregar”. Observe que la flecha hacia abajo le 
permite elegir entre varios tipos de restricciones (<=, >=, = y entero). Así, es posible forzar el nú- 
mero del paracaídas (ES) para que sea un entero. 

Una vez introducidas las tres restricciones, se selecciona el botón “aceptar” para regresar al cuadro 
de diálogo de Solver. Después de seleccionar esta opción vuelva al menú de Solver. Cuando seleccione 
el botón “aceptar” se abrirá un cuadro de diálogo con un reporte sobre el éxito de la operación. En el 
caso presente, el Solver obtiene la solución correcta como se indica en la figura 15.7. 

De esta forma, se determina que el costo mínimo es $4377.26 si se divide la carga en seis pa- 
quetes con un radio del paracaídas de 2.944 m. Además de obtener la solución, el Solver también 
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Parámetros: Variables de diseño: 
y Mt 2000 ls 2.943652 
19 9.8 n 6 
| cost1 200 
| cost2 56 Restricciones: 
cost3 0.1 
vc 20 variable tipo límite 
kc 3 v 20 <= 20 
z0 500 n 6 >= 1 
a] Valores calculados: Función objetivo: 
la 54.44435 
I 4.162953 Costo 4377.264 Figura 15.7 
' ds Hoja de cálculo en Excel con la 
solución del problema de opti- 
19 | Raíz localización: mización no lineal referente al 
27.04077 paracaídas. 
1(0 27.04077 


proporciona algunos reportes en resumen útiles. Estos se explorarán en las aplicaciones a la ingenie- 
ría que se describirán en la sección 16.2. 


15.3.3 MATLAB 


Como se resume en la tabla 15.1, MATLAB tiene varias funciones incorporadas para optimización. 
Los siguientes dos ejemplos ilustran cómo utilizarlas. 


Tabla 15.1 Funciones de MATLAB para optimización. 


Función Descripción 
fminbnd Minimiza una función de una variable con restricciones 
fminsearch Minimiza una función de varias variables 


EJEMPLO 15.5 Uso de MATLAB para la optimización unidimensional 


Planteamiento del problema Utilice la función fminbnd de MATLAB para encontrar el 
máximo de 
2 


x 
fa)=2 Adi y 


en el intervalo x,=0 y x, = 4. Recuerde que en el capítulo 13 empleamos varios métodos para resol- 
ver este problema para x= 1.7757 y f(x) = 1.4276. 
Solución Primero, necesitamos crear un archivo fx.m para la función. 


function f=fx(x) 
f = -(2*sin(x)-x"2/10) 


Como lo que nos interesa es la maximización, introducimos el negativo de la función. A continuación 
llamamos a la función £fminbnd con 

[x, £]=fminbnd ('fx'",0,4) 
El resultado es 


ES 
-1.7757 
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Xx = 
1.4275 


Observe que se pueden incluir más argumentos. Una adición útil es establecer opciones de opti- 
mización, como tolerancia de error o máximo de iteraciones. Esto se hace con la función optimset, 
que se utilizó previamente en el ejemplo 7.6 y que tiene el formato general 


optimset ('param,', value,, 'param,',value,,...) 


donde param, es un parámetro que especifica el tipo de opción y value, es el valor asignado a esa 
opción. En el ejemplo si se quiere establecer la tolerancia de 1 x 107, 


optimset ('Tol1X',le-2) 
De esta manera la solución del presente problema con una tolerancia de 1 x 10? se genera con 
>> fminbnd('fx',0,4,optimset ('TolX',le-2)) 


cuyo resultado es 


f = 
=Laddo7 


ans = 
1.4270 


Un conjunto completo de parámetros se encuentra llamando a “Help” (Ayuda) 


>> Help optimset 


MATLAB tiene diversas capacidades para manejar funciones multidimensionales. Recuerde 
del capítulo 13 que la imagen visual de una búsqueda unidimensional era la de una montaña rusa. 
Para casos bidimensionales, la imagen se vuelve la de montañas y valles. Como en el siguiente 
ejemplo, las capacidades gráficas de MATLAB proporcionan un medio cómodo para visualizar 
tales funciones. 


EJEMPLO 15.6 Visualización de una función bidimensional 


Planteamiento del problema Use las capacidades gráficas de MATLAB para mostrar la si- 
guiente función y estimar visualmente su mínimo en el rango -2<x,S0y0<x,<3: 


(01,12) =2+x1 —x2 +2x7 +2x1%2 +x5 


Solución El siguiente código genera gráficas de contorno y malla de la función: 


x=linspace (-2,0,40);y=linspace(0,3,40); 
[X, Y] = meshgrid(x, y); 
Z=24X-Y42*X.02+2*X.*Y4+Y.0%2; 

subplot (1,2,1); 
cs=contour (X, Y,Z);clabel (cs); 
xlabel('x_1');ylabel('x_2'); 

title(' (a) Contour plot');grid; 

subplot (1,2,2); 

cs=surfc(X,Y,Z); 

zmin=floor (min(Z)); 

zmax=ceil (max (Z));5 

xlabel('x_1');ylabel ('x_2');zlabel('f(x_1,x_2)'); 
title(' (b) Mesh plot'); 
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Como se muestra en la figura 15.8, ambas gráficas indican que la función tiene un valor mínimo de 
alrededor de f(x,, x,) =0 a 1, ubicado alrededor de x, =-1 y x, = 1.5. 

El MATLAB estándar tiene una función fminsearch que se puede usar para determinar el 
mínimo de una función multidimensional. Se basa en el método Nelder-Mead, un método de bús- 
queda directa que sólo usa valores de función (no necesita derivadas) y maneja funciones objetivo 
no continuas. Una expresión sencilla de su sintaxis es 


[xmin, fval] = fminsearch(function, x1,x2) 


Donde xmin y £fval son la ubicación y el valor del mínimo, function es el nombre de la función 
que se está evaluando, y x1 y x2 son los límites del intervalo que se está explorando. 
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EJEMPLO 15.7 Uso de MATLAB para optimización multidimensional 


Planteamiento del problema Use la función fminsearch de MATLAB para encontrar el 
máximo para la función simple que se graficó en el ejemplo 15.6. 


f(x], x2) =2+x; —x2 +2x?+2x1%2 +x% 


Utilice valores iniciales de x =-—0.5 y y =0.5. 


Solución Se puede llamar la función £minsearch con 


>> f= (x) 2+x(1)-x(2)+2*x (1) 2+2*x (1) *x (2) +x (2)2; 
>> [x,fval]=fminsearch(f,[-0.5,0.5]) 
x= 
-1.0000 1.5000 
fval = 
0.7500 


Igual que con £minbnad, se pueden incluir argumentos con objeto de especificar parámetros adicio- 
nales del proceso de optimización. Por ejemplo, la función optimset se puede usar para limitar el 
número máximo de iteraciones 


>> [x,fval]=fminsearch(f, [-0.5,0.5],optimset ('MaxIter',2)) 


con el resultado 
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Exiting: Maximum number of iterations has been exceeded 
- increase MaxlIter option. 
Current function value: 1.225625 
x= 
-0.5000 0.5250 
fval = 
1.2256 


Así, como se ha establecido un límite muy estricto a las iteraciones, la optimización termina bastan- 
te antes de llegar al máximo. 


15.3.4 Mathcad 


Mathcad contiene una función de modo numérico que se llama Find, la cual puede usarse para re- 
solver hasta 50 ecuaciones algebraicas simultáneas no lineales con restricciones de desigualdad. El 
uso de esta función para aplicaciones sin restricciones se describió en la parte dos. Si Find no logra 
ubicar una solución que satisfaga las ecuaciones y las restricciones, devuelve al usuario el mensaje 
de error “Did not find solution”. Sin embargo, Mathcad también contiene una función similar que se 
llama Minerr. Ésta da resultados de solución que minimizan los errores en las restricciones, inclu- 
so cuando no se pueden encontrar soluciones exactas. Esta función resuelve ecuaciones y acepta 
diversas restricciones usando el método Levenberg-Marquardt, tomado de los algoritmos de dominio 
público MINPACK, desarrollados y publicados por el Argonne National Laboratory. 

Ahora se va a desarrollar un ejemplo en el que se usa Find para resolver un sistema de ecuacio- 
nes no lineales con restricciones. Se introducen valores iniciales de x =-1 y y = 1 usando el símbo- 
lo de definición como se muestra en la figura 15.9. La palabra Given alerta entonces a Mathcad de 
que lo que viene en seguida es un sistema de ecuaciones. Entonces se pueden introducir las ecuacio- 
nes y la restricción de desigualdad. Observe que, para esta aplicación, Mathcad necesita usar un 
signo de igual simbólico (que se teclea como [Ctrl] =) y > para separar los lados izquierdo y derecho 
de una ecuación. Ahora, el vector que consiste en xval y yval se calcula usando Find(x,y) y los 
valores se muestran empleando un signo de igual. 

Se puede colocar en la hoja de cálculo una gráfica que muestre las ecuaciones y las restricciones, 
así como la solución, haciendo clic en la ubicación deseada. Esto pone una retícula roja en dicha 


M'Mathcad 


CONSTRAINED NONLINEAR OPTIMIZATION 
Guess values: 


ie mej] 2) 


Given 
Constrained nonlinear system 

x2+y=6 
Determine solution: (6-x2)5 


(6 —xx205 le 


xval , 
les == Find(x,y) 


xval = 2,414 yval = 0.414 


Figura 15.9 

Pantalla Mathcad para un pro- 
blema de optimización no lineal 
con restricciones. 
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ubicación. Luego use en la barra de menú Insert/Graph/X-Y Plot para colocar una gráfica en blanco 
en la hoja de cálculo con espacios para las expresiones que se graficarán y para los rangos de los ejes 
x y y. Se grafican cuatro variables en el eje y como se muestra: las mitades superior e inferior de la 
ecuación para la circunferencia, la función lineal y una línea vertical para representar la restricción 
x > 2. Además, se incluye la solución como un punto. Una vez que se ha creado la gráfica, se puede 
usar en la barra del menú Format/Graph/X-Y Plot para variar el tipo de gráfica, cambiar el color, el 
tipo y grosor de la traza de la función, y agregar títulos, rótulos y otras características. La gráfica y 
los valores numéricos para xval y yval ilustran muy bien la solución como la intersección de la 
circunferencia y la línea en la región en la que x > 2. 


PROBLEMAS 


15.1 Una compañía fabrica dos tipos de productos, A y B. Éstos se 
fabrican durante una semana laboral de 40 horas para enviarse al 
final de la semana. Se requieren 20 kg y 5 kg de materia prima por 
kilogramo de producto, respectivamente, y la compañía tiene acceso 
a 9500 kg de materia prima por semana. Sólo se puede crear un 
producto a la vez, con tiempos de producción para cada uno de ellos 
de 0.04 y 0.12 horas, respectivamente. La planta sólo puede almace- 
nar 550 kg en total de productos por semana. Por último, la compañía 
obtiene utilidades de $45 y $20 por cada unidad de A y B, respecti- 
vamente. Cada unidad de producto equivale a un kilogramo. 

a) Plantee el problema de programación lineal para maximizar la 
utilidad. 

b) Resuelva en forma gráfica el problema de programación lineal. 

c) Solucione el problema de programación lineal con el método 
simplex. 

d) Resuelva el problema con algún paquete de software. 

e) Evalúe cuál de las opciones siguientes elevaría las utilidades al 
máximo: incrementar la materia prima, el almacenamiento, o el 
tiempo de producción. 

15.2 Suponga que para el ejemplo 15.1, la planta de procesamiento 
de gas decide producir un tercer grado de producto con las caracte- 
rísticas siguientes: 


Supremo 


Gas crudo 15 m/ton 
Tiempo de producción 12 h/ton 
Almacenamiento 5 ton 


Utilidad $250/ton 
Además, suponga que se ha descubierto una nueva fuente de gas 
crudo, lo que duplicó el total disponible a 154 m'/semana. 

a) Plantee el problema de programación lineal para maximizar la 
utilidad. 

b) Resuelva el problema de programación lineal con el método 
simplex. 

c) Solucione el problema con un paquete de software. 

d) Evalúe cuál de las opciones siguientes aumentaría las utilidades 
al máximo: incrementar la materia prima, el almacenamiento, o 
el tiempo de producción. 

15.3 Considere el problema de programación lineal siguiente: 
Maximizar f(x, y) = 1.75x + 1.25y 
sujeta a: 


1.2x+2.25y < 14 
x+1.1y<8 


2.5x+ y<9 
x20 
y20 

Obtenga la solución: 

a) En forma gráfica. 

b) Usando el método simplex. 

c) Utilizando un paquete de software apropiado (por ejemplo, 

Excel, MATLAB o Mathcad). 

15.4 Considere el problema de programación lineal que sigue: 


Maximizar f(x, y) = 6x + 8y 
sujeta a 


5x+2y<40 
6x + 6y< 60 
2x + 4y < 32 
x20 
y20 


Obtenga la solución: 

a) En forma gráfica. 

b) Usando el método simplex. 

c) Utilizando un paquete de software apropiado (por ejemplo, 

Excel). 

15.5 Emplee un paquete de software (por ejemplo, Excel, MATLAB 
o Mathcad) para resolver el problema siguiente de optimización no 
lineal con restricciones: 


Maximizar f(x, y) = 1.2x + 2y — y 
sujeta a 
2x+y<2 
x>0 
y20 
15.6 Utilice un paquete de software (por ejemplo, Excel, MATLAB 


o Mathcad) para resolver el siguiente problema de optimización no 
lineal con restricciones: 


Maximizar f(x, y) = 15x + 15y 
sujeta a 

X+ys<1 

x+2y<2.1 

x>20 

y20 
15.7 Considere el problema siguiente de optimización no lineal con 
restricciones: 

Minimizar fx, y) = (x— 3) + (y —- 3) 


sujeta a 
x+2y=4 


a) Utilice el enfoque gráfico para estimar la solución. 

b) Emplee un paquete de software (como Excel) para obtener una 
estimación más exacta. 

15.8 Use un paquete de software para determinar el máximo de 


Fc, y) =2.25xy + 1.75y — 1.51% - 2y* 

15.9 Emplee un paquete de software para determinar el máximo de 
Fa, y) =4x+2y +1 2x* + 2xy - 3y? 

15.10 Dada la función siguiente, 
FG, y) =-8x ++ 12y + 4y% 2xy 


use un paquete de software para determinar el mínimo: 

a) En forma gráfica. 

b) Numéricamente. 

c) Sustituya el resultado del inciso b) en la función a fin de deter- 
minar el valor mínimo de f(x, y). 

d) Determine el Hessiano y su determinante, y sustituya el resultado 
del inciso b) para verificar que se detectó un mínimo. 

15.11 Se le pide a usted que diseñe un silo cónico cubierto para alma- 

cenar 50 m' de desechos líquidos. Suponga que los costos de excavación 
son de $100/m', los de cubrimiento lateral son de $50/m? y los de la 
cubierta son de $25/m?. Determine las dimensiones del silo que mini- 
mizan el costo a) si la pendiente lateral no está restringida y b) la pen- 
diente lateral debe ser menor de 45*. 

15.12 Una compañía automotriz tiene dos versiones del mismo 
modelo de auto para vender, un cupé de dos puertas y otro de tama- 
ño grande de cuatro puertas. 

a) Encuentre gráficamente cuántos autos de cada diseño deben 
producirse a fin de maximizar la utilidad, y diga de cuánto es 
esta ganancia. 

b) Con Excel, resuelva el mismo problema. 


Dos Cuatro 
puertas puertas Disponibilidad 
Utilidad $13 500/auto $15000/auto 
Tiempo de producción 15 h/auto 20 h/auto 8000 h/año 
Almacenamiento 400 autos 350 autos 
Demanda del consumidor 700/auto 500/auto 240000 autos 


15.13 Og es el líder de la tribu de cavernícolas Calm Waters, que 
está sorprendentemente avanzada en matemáticas, aunque con mu- 
cho atraso tecnológico. Él debe decidir acerca del número de mazos 
y hachas de piedra que deben producirse para la batalla próxima 
contra la tribu vecina de los Peaceful Sunset. La experiencia le ha 
enseñado que un mazo es bueno para generar en promedio 0.45 
muertes y 0.65 heridas, en tanto que un hacha produce 0.70 muertes 
y 0.35 heridas. La producción de un mazo requiere 5.1 libras de 
piedra y 2.1 horas-hombre de trabajo, mientras que para un hacha se 
necesitan 3.2 libras de piedra y 4.3 horas-hombre de trabajo. La 
tribu de Og dispone de 240 libras de piedra para la producción de 
armas, y de un total de 200 horas-hombre de trabajo, antes de que 
pase el tiempo esperado para esta batalla (la cual, Og está seguro, 
pondrá fin para siempre a la guerra). Al cuantificar el daño que se 
inflige al enemigo, Og valora una muerte tanto como dos heridas, y 
desea producir la mezcla de armas que maximice el daño. 


Problemas 325 


a) Formule la situación como un problema de programación lineal. 
Asegúrese de definir las variables de decisión. 

b) Represente este problema en forma gráfica, y asegúrese de 
identificar todos los puntos de esquina factibles, así como los 
no factibles. 

c) Resuelva el problema de forma gráfica. 

d) Solucione el problema con el uso de una computadora. 

15.14 Desarrolle un archivo M que esté expresamente diseñado 

para ubicar un máximo con el algoritmo de búsqueda de sección 
dorada. En otras palabras, configure if de tal manera que encuentre 

directamente el máximo en vez de encontrar el mínimo de —f(x). 

Pruebe su programa con el mismo problema que el del ejemplo 13.1. 

La función debe tener las siguientes características: 

» Tterar hasta que el error relativo caiga por debajo de un criterio 
de detención o se exceda un número máximo de iteraciones. 

» Devolver tanto la x óptima como f(x). 

15.15 Desarrolle un archivo M para ubicar un mínimo con la bús- 

queda de sección dorada. En vez de usar los criterios estándar de 

detención (como en la figura 13.5), determine el número de iteracio- 
nes necesarias para alcanzar una tolerancia deseada. 

15.16 Desarrolle un archivo M para implementar la interpolación 

parabólica y ubicar un mínimo. Pruebe su programa con el mismo 
problema que en el ejemplo 13.2. La función debe tener las siguien- 
tes características: 

+ Estar basada en dos valores iniciales y haga que el programa ge- 
nere el tercer valor inicial en el punto medio del intervalo. 

+ Verificar silos valores abarcan un máximo. Si no, la función no 
debe implementar el algoritmo, sino devolver un mensaje de 
error. 

» Iterar hasta que el error relativo caiga por debajo del criterio de 
detención o se exceda un número máximo de iteraciones. 

+ Devolver tanto x óptima como f(x). 

+ Usar un enfoque cerrado (como en el ejemplo 13.2) para reem- 
plazar valores viejos por nuevos. 

15.17 La longitud de la escalera que puede resolver la esquina que 

se describe en la figura P15.17 se puede determinar calculando el 

valor de 9 que minimiza la siguiente función: 


Wi wa 


L(0) = 


senó  sen(r — q —0) 


Para el caso en el que w, = w, = 2 m, utilice un método numérico 
(incluyendo software) para desarrollar una gráfica de L contra una 
gama de a de 45% a 135". 


Figura P15.17 
Una escalera resolviendo el paso por una esquina formada por 
dos pasillos. 


Estudio de casos: 
optimización 


El propósito de este capítulo es utilizar los métodos numéricos analizados en los capítulos 13 al 15 
para resolver problemas prácticos de ingeniería que involucren optimización. Estos problemas son 
importantes, ya que a los ingenieros con frecuencia se les pide que den la “mejor” solución a un 
problema. Como muchos de estos casos implican sistemas complicados e interacciones, entonces los 
métodos numéricos y las computadoras son necesarios para desarrollar soluciones óptimas. 

Las siguientes aplicaciones son típicas de aquellas que se encuentran en forma rutinaria duran- 
te los estudios superiores y de graduados. Además, son representativas de problemas con los que se 
enfrentará el ingeniero profesionalmente. Los problemas se toman de las áreas de la ingeniería si- 
guientes: química/bioingeniería, civil/ambiental, eléctrica y mecánica/aeronáutica. 

La primera aplicación, tomada de la ingeniería química/bioingeniería, tiene que ver con el uso 
de la optimización no lineal con restricciones para el diseño óptimo de un tanque cilíndrico. Se usa 
el Solver de Excel para encontrar la solución. 

Después, se utiliza la programación lineal para resolver un problema de la ingeniería civil/ 
ambiental: minimizar el costo del tratamiento de aguas residuales para cumplir con los objetivos de 
calidad del agua en un río. En este ejemplo, se expone la noción de los precios indefinidos y su uso 
para mostrar la sensibilidad de una solución en programación lineal. 

La tercera aplicación, tomada de la ingeniería eléctrica, implica maximizar la potencia a través 
de un potenciómetro en un circuito eléctrico. La solución involucra optimización sin restricciones 
unidimensional. Además de resolver el problema, se muestra cómo el lenguaje macro de Visual 
Basic permite el acceso al algoritmo de búsqueda de la sección dorada, dentro del contexto del am- 
biente Excel. 

Finalmente, la cuarta aplicación, tomada de la ingeniería mecánica/aeroespacial, incluye la 
determinación de la posición de equilibrio de un sistema de resortes múltiples con base en la energía 
potencial mínima. 


16.1 DISEÑO DE UN TANQUE CON EL MENOR COSTO 
(INGENIERÍA QUÍMICA/BIOINGENIERÍA) 


Antecedentes Los ingenieros químicos (así como otros especialistas como los ingenieros me- 
cánicos y civiles) con frecuencia se enfrentan al problema general del diseño de recipientes que 
transporten líquidos o gases. Suponga que se le pide determinar las dimensiones de un tanque cilín- 
drico pequeño para el transporte de desechos tóxicos que se van a trasladar en un camión. Su obje- 
tivo general será minimizar el costo del tanque. Sin embargo, además del costo, usted debe asegurar 
que pueda contener la cantidad requerida de líquido y que no exceda las dimensiones de la caja del 
camión. Debido a que el tanque transportará desechos tóxicos, se requiere que éste sea de un espesor 
determinado, dentro de ciertas regulaciones. 

Un esquema del tanque y de la caja se muestra en la figura 16.1. Como se observa, el tanque es 
un cilindro con dos placas soldadas en cada extremo. 

El costo del tanque tiene dos componentes: 1) gastos del material, que están basados en el peso, 
y 2) gastos de soldadura que se basan en la longitud a soldar. Note que esto último consiste en soldar 
tanto la junta interior como la junta exterior donde las placas se unen con el cilindro. Los datos nece- 
sarios para el problema se resumen en la tabla 16.1. 
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Tabla 16.1 Parámetros para determinar las dimensiones E A 
óptimas de un tanque cilíndrico para transporte La t 
de desechos tóxicos. 8 [— 
Parámetro Símbolo Valor Unidades 
Volumen requerido v, 0.8 m? 
Espesor t 3 cm 
Densidad p 8000 kg/m? 
Longitud de la caja Enáx 2 m 
Ancho de la caja Dist 1 m 
Costo del material C-, 4.5 $/kg 
20 $/m 


Costo de soldadura C 
A “— p A 
] max 


Figura 16.1 
Parámetros para determinar las dimensiones óptimas 
de un tanque cilíndrico. 


Solución El objetivo aquíes construir un tanque a un costo mínimo. 
El costo está relacionado con las variables de diseño (longitud y diá- 
metro), ya que tienen efecto sobre la masa del tanque y las longitudes 
a soldar. Además, el problema tiene restricciones, pues el tanque debe 
1) caber en la caja del camión y 2) tener capacidad para el volumen 
requerido de material. 

El costo se obtiene de los costos del material del tanque y de la 
soldadura. Por lo tanto, la función objetivo se formula como una mi- 
nimización 

C=cC,m>+c,f (16.1) 


wow 


donde C = costo ($), m = masa (kg), €, = longitud a soldar (m), c,, y c,, = factores de costo por masa 
(S/kg) y longitud de soldadura ($/m), respectivamente. 

Después, se relacionan la masa y la longitud de soldadura con las dimensiones del tambor. Pri- 
mero, se calcula la masa como el volumen del material por su densidad. El volumen del material 
usado para construir las paredes laterales (es decir, el cilindro) se calcula así: 


2 2 
Veitindro = LT (2+:) (2) 
2 2 


Para cada placa circular en los extremos, 


v 


D 2 
placa 5 (+ y) Í 


Así, la masa se calcula mediante 


6 ) al 6 ' 

m=p3Li | —+t| - | —]| [+27] —+1|f (16.2) 
2 2 2 

donde p = densidad (kg/m'). 


La longitud de soldadura para unir cada placa es igual a la circunferencia interior y exterior del 
cilindro. Para las dos placas, la longitud total de soldadura será 


La 0 202 +1)+252 - 4T(D+1t) (16.3) 


Dados los valores para D y £ (recuerde que el espesor 1 es fijado por un reglamento), las ecuaciones 
(16.), (16.2) y (16.3) ofrecen un medio para calcular el costo. También observe que cuando las 
ecuaciones (16.2) y (16.3) se sustituyen en la ecuación (16.1), la función objetivo que se obtiene es 
no lineal. 

Después, se formulan las restricciones. Primero, se debe calcular el volumen que el tanque 
terminado puede contener, 
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2 
v-P, 
4 


Este valor debe ser igual al volumen deseado. Así, una restricción es 


2 
TD 4) 
A 


donde V, es el volumen deseado (m?). 

Las restricciones restantes tienen que ver con que el tanque se ajuste a las dimensiones de la caja 
del camión, 

L< Emáx 

D<D 


máx 


El problema ahora está especificado. Con la sustitución de los valores de la tabla 16.1, se resume 
como 


Maximizar C = 4.5m + 20€, 
sujeto a 
AD"L 
4 
L<2 
D<l 


0.8 


donde 
$94 2 2 
m =8 000; La E + 0.05) - 2) san + 005) 0.03 


€.=4x(D+0.03) 


El problema ahora se puede resolver de diferentes formas. Sin embargo, el método más simple 
para un problema de esta magnitud consiste en utilizar una herramienta como el Solver de Excel. La 
hoja de cálculo para realizar esto se muestra en la figura 16.2, 


J-—A A A A E E | 
1 | Diseño del tanque óptimo 
7 
3 | Parámetros: Variables de diseño: 
4 vO 0.8 D 1 
5 t 0.03 L 2 
6 rho 8000 
7 Lmáx 2 Restricciones: 
8 Dmáx 1 D | 1 <= 1 
9 cm 4.5 L | 2 <= 
10 cw 20 Vol 1.570796 = 0.8 
Figura 16.2 141] 
Hoja de cálculo de Excel lista 12 Valores calculados: Función objetivo: 
13 m 1976.791. C 9154.425 
para evaluar el costo de un e CUE 
tanque sujeto a restricciones de 15 
volumen y tamaño. 16 | Vcoraza | 0.19415| 
17 | Vtapas _0.052948 | 


En el caso mostrado, se introducen los límites superiores para D y L. En este caso, el volumen 
es mayor que el requerido (1.57 > 0.8). 


16.2 Mínimo costo para el tratamiento de aguas residuales (ingeniería civil/ambiental) 
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Una vez creada la hoja de cálculo, la selección Solver se elige del menú Tools (Herramientas). Aquí 
aparecerá una ventana de diálogo que le solicitará la información pertinente. Las celdas correspondien- 


tes para el cuadro de diálogo Solver se pueden llenar así 


Parámetros de Solver 
Celda objetivo: | sEs13 5 
Valor de la 


celda objetivo: € Máximol* Mínimo — Valores de: | 0 
¡Cambiando las celdas: 


[SES4:$E$5 e] Estimar 


Sujetas a las siguientes restricciones: 
Agregar... 
Cambiar... 
le] Eliminar 


$SE$10 = $G$10 
$ES8 < = $G$8 
$ES9 <= $G$9 


21x] 
Cerrar 


Opciones 


Bestabiece!] 
Ayuda 


Al seleccionar el botón Resolver, un cuadro de diá- 


logo se abrirá mostrando un reporte sobre el éxito de la : Diseño del tanque óptimo 

operación. En el presente caso, Solver obtiene la solución EN Parámetros: Va nablES de diseño 

correcta, la cual se muestra en la figura 16.3. Observe que 4 vo 0.8 D 0.98351 

el diámetro óptimo es casi el valor de la restricción de 1 - E 0.03 L 1.053083 

a ; B h 00 
m. Así, si aumentara la capacidad requerida del tanque, — a aa — 
y ] e la Ss 7 |Lmáx 2 Restricciones 

podría quitarse esta restricción y el problema se reduciría 8 |Dmáx 1 D 0.98351 <= 1 

a una búsqueda unidimensional para la longitud. 9 |cm 4.5 L _ 1.053033 <= 
10 0w 20 Vol 0.799999 = 0.8 
11 

Figura 16.3 12 | Valores calculados: Función objetivo: 

A ] 13m 1215.206 G 5723.149 

Resultados de la minimización. El precio se reduce de Aa al 

$9154 a $5723, debido al menor volumen con dimensio- 15 | 

nesD=0.98myl=1.05 m. 16 | Vcoraza 0.100587 
17 |Vtapas 0.051314 


16.2 MÍNIMO COSTO PARA EL TRATAMIENTO DE 
AGUAS RESIDUALES (INGENIERÍA CIVIL/ 
AMBIENTAL) 


Antecedentes Las descargas de aguas residuales de las grandes ciudades 
son, con frecuencia, la causa principal de la contaminación en un río. La 
figura 16.4 presenta el tipo de sistema que un ingeniero ambiental podría 
enfrentar. Varias ciudades están localizadas en las orillas de un río y sus 
afluentes. Cada una genera contaminación a una razón de carga P en uni- 
dades de miligramos por día (mg/d). La carga contaminante está sujeta al 
tratamiento de desechos que resultan de una remoción fraccional x. Así, la 
cantidad descargada al río es el exceso no removido por el tratamiento, 


W.=(1-x)P, (16.4) 


donde W, = descarga de desechos de la ¡-ésima ciudad. 

Cuando las descargas de desechos entran en la corriente, se mezclan 
con los contaminantes de las fuentes corriente arriba. Si se supone un mez- 
clado completo en el punto de descarga, la concentración resultante en el 
punto de descarga se calcula con un simple balance de masa, 


Figura 16.4 

Cuatro plantas de tratamiento de aguas residua- 
les que descargan contaminantes a un sistema de 
ríos. Los segmentos del río entre las ciudades es- 
tán marcados con números dentro de un círculo. 
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EA (16.5) 

O, 
donde O, = flujo (L/d), c, = concentración (mg/L) en el río corriente arriba de la descarga y O, = 
flujo corriente abajo del punto de descarga (L/d). 

Después de que se establece la concentración en el punto de mezclado, los procesos de descom- 
posición químicos y biológicos pueden eliminar algo de contaminación, conforme fluye corriente 
abajo. En el presente caso, se supone que esta eliminación puede representarse por un simple factor 
de reducción R. 

Suponiendo que las fuentes de agua (es decir, las ciudades 1 y 2 en el río mostrado antes) están 
libres de contaminantes, las concentraciones en los cuatro nodos se calculan así: 


a (1=x,)B (16.6) 
y = AL 
O, 
Ba (1-x)P 
0, 
c,= Ri3Q30, + R20,0, HU -x,)P, 
j 34 
—RiQu40s +0 xP, 
e 
Qs; 


Después, se observa que el tratamiento de aguas tiene un costo diferente, d, ($1 000/mg elimi- 
nado), en cada una de las instalaciones. Así, el costo total de tratamiento (sobre una base diaria) se 
calcula como 


Z=d,P¡x, + d,P,x, + dy¿P3x, + d¿Paxa (16.7) 


donde Z es el costo total diario del tratamiento ($1000/d). 

La pieza final en la “decisión” son las regulaciones ambientales. Para proteger los usos benéfi- 
cos del río (por ejemplo, paseos en bote, pesca, uso como balneario), las regulaciones indican que 
la concentración del río no debe exceder un estándar de calidad c, en el agua. 

En la tabla 16.2 se resumen los parámetros para el sistema de ríos de la figura 16.4. Observe que 
hay una diferencia en los costos de tratamiento entre las ciudades corriente arriba (1 y 2) y corrien- 
te abajo (3 y 4), debido a la naturaleza obsoleta de las plantas corriente abajo. 


Tabla 16.2 Parámetros para las cuatro plantas de tratamiento de aguas residuales que descargan contaminantes a 
un sistema de ríos, junto con las concentraciones resultantes (c;) para tratamiento cero. También se dan el 
flujo, el factor de remoción y los estándares para los segmentos del río. 


Ciudad 


d, ($10*/mg) c; (mg/L) Segmento Q (L/d) R c, (mg/L) 


P; (mg/d) 
1 1.00x 10? 2 100 1-3 1.00x 107 0.5 20 
2 2.00 x 10? 2 40 2-3 5.00 x 107 0.35 20 
3 4.00x 10? 4 47.3 3-4 1.10 x 10% 0.6 20 
4 2.50 x 10? 4 DIDAS 4-5 2.50 x 10% 20 


La concentración se calcula con la ecuación (16.6) y el resultado se presenta en la columna 
sombreada, para el caso en que no se implementó tratamiento de residuos (es decir, donde todas las 
x = 0). Observe que el estándar de 20 mg/L se viola en todos los puntos de mezclado. 

Utilice la programación lineal para determinar los niveles de tratamiento que satisfacen los es- 
tándares de calidad del agua a un costo mínimo. También evalúe el impacto al hacer el estándar más 
restringido debajo de la ciudad 3. Es decir, realice el mismo ejercicio; pero ahora con los estándares 
para los segmentos 3-4 y 4-5 disminuidos a 10 mg/L. 
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Solución Todos los factores antes mencionados se combinan en el siguiente problema de progra- 
mación lineal: 


Minimizar Z= d,P,x, + d,P,x, + d¿Pxx, + d,¿PyXa (16.8) 
sujeto a las siguientes restricciones 
(1=xDA e 
0, 
1-x)P 
UD dl (16.9) 
0, 
R¡,Q,30, +R,0,30, HU—x,)P, 
ES Cs 
Oy 
R +(1-x,)P 
2403403 +0 —x4)P, TN 
Ds (16.10) 


0S x,,X,,X3,X, Sl 


De esta forma, la función objetivo es para minimizar el costo del tratamiento [ecuación (16.8)] 
sujeto a la restricción de los estándares de calidad del agua que se deben satisfacer en todas las 
partes del sistema [ecuación (16.9)]. Además, el tratamiento no debe ser negativo o mayor que el 
100% de remoción [ecuación (16.10)]. 

El problema se resuelve utilizando diversos paquetes. Para esta aplicación se utiliza la hoja de 
cálculo Excel. Como se observa en la figura 16.5, los datos junto con los cálculos de la concentra- 
ción se pueden introducir fácilmente en las celdas de la hoja de cálculo. 


A B C D E F G H 
1 | Costo mínimo del tratamiento de aguas residuales 
2 No tratada Tratamiento Descarga Costo unit. Concent. Estándar Costo de Ñ 
3 Ciudad  P x wW d en el río de CA tratamiento Figura 16.5 
a 11 1.005+09 O 1.00E+09 2.00E-06| 100.00 20.00 0.00 Hoja de cálculo de Excel lista para evaluar el costo del 
5 2  2.00E+09 O 2.00E+09 2.00E-06 40.00 20.00 0.00 A . ” 
7 O OETOS O Emo IE 77 30.06 000 tratamiento de aguas en un sistema de ríos regulado. 
7 4 2.50E+09 O 2.50E+09 4.00E-06 22.48 20.00 ooo La columna F contiene el cálculo de la concentración de 
8 Flujo en Remoción acuerdo con la ecuación (16.6). Las celdas F4 y H4 están 
| CAES REL pai 0.0 resaltadas para mostrar las fórmulas usadas para calcular 
1123 5.00E+07 0.35 c, y el costo del tratamiento para la ciudad 1. Además, se 
12 3-4 1.10E+08 0.6 resalta la celda H9 que muestra la fórmula para el costo 
13 4-5 2.50E+08 dd A 

total que es el que hay que minimizar [ecuación (16.8)). 


=D4/B10 =$B$4*$C$4*$E$4 —=SUM(H4:H7) 


Una vez que se crea la hoja de cálculo, se elige la selección Solver del menú Tools (Herramien- 
tas). En este punto, se desplegará una ventana de diálogo, solicitándole la información pertinente. 
Las celdas correspondientes para el cuadro de diálogo se podrían llenar así 


Resolver... 
Cerrar 


Parámetros de Solver 
Celda objetivo: — [MEN >] 
Valor de la 


celda objetivo” Máximo'* Mínimo € Valores de: fo 
- Cambiando las celdas: 


| $C$4:$C$7 | Estimar 


| Sujetas a las siguientes restricciones: 


Opciones... 


ps a Agregar... 

$C$7 >=0 Agreg: 

pi e Cambiar... 

$F$5 <=$G$5 [9 

Hb == - Eliminar Restablecer 
7 <= 7 > — 
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Observe que no se muestran todas las restricciones, ya que el cuadro de diálogo despliega sólo 
seis restricciones a la vez. 

Cuando se selecciona el botón Resolver, se abre un cuadro de diálogo con un reporte sobre el 
éxito de la operación. En el presente caso, Solver obtiene la solución correcta, la cual se muestra en 
la figura 16.6. Antes de aceptar la solución [al seleccionar el botón OK (aceptar) en el cuadro repor- 
te del Solver], observe que se hayan generado 3 reportes: Respuesta, Sensibilidad y Límites. Selec- 
cione el reporte Sensibilidad y después presione el botón OK para aceptar la solución. Solver 
generará automáticamente un reporte de sensibilidad, como el de la figura 16.7. 

Ahora examinemos la solución (figura 16.6). Observe que el estándar será satisfecho en todos 
los puntos de mezclado. De hecho, la concentración en la ciudad 4 en realidad será menor que el 
estándar (16.28 mg/L), a pesar de que no se requerirá tratamiento para la ciudad 4. 


| AN | E | F | Ga |Haaa |] 
1 Costo mínimo del tratamiento de aguas residuales 
l 2 | Notratada Tratamiento Descarga Costo unit.  Concent. Estándar Costo del 
3 Ciudad P Xx wW d en el río de CA tratamiento 
, 4) 1 1.00E+09 0.80 | 2.00E+08 2.00E-06 20.00 20.00 1600.00 
Figura 16.6 Oo all 2 2.00E+09 0.50 | 1.00E+09 2.00E-06 20.00 20.00 2000.00 
Resultados de la minimización. Los es- 61] 3 4.00E+09 0.5625 1.75E+09 4.00E-06 20.00 20.00 9000.00 
tándares de calidad del agua se satista- 17 4 2.50E+09 0.00 | 2.50E+09 4.00E-06. 15.28 20.00 0.00 
cen a un costo de $12 600/día. Observe e Flujo en Remoción | 
que a pesar del hecho de que no se 9 Segmento elrío en el río Total 12600.00 | 
requiere tratamiento para la ciudad 4, la | 10 1-3 1.00E+07 0.5 
concentración en su punto de mezclado 11 (2-3 5.00E+07 0.35 
excede el estándar. 12 3-4 1.10E+08 0.6 
13 4-5 2.50E+08 


Como un ejercicio final, se pueden disminuir los estándares de 3-4 y 4-5 para tener 10 mg/L. 
Antes de hacerlo, se examina el reporte de sensibilidad. En el caso presente, la columna clave de la 
figura 16.7 es la de los multiplicadores de Lagrange (el precio anticipado). El precio anticipado es 
un valor que expresa la sensibilidad de la función objetivo (en nuestro caso, el costo) a una unidad 
de cambio de una de las restricciones (estándares de calidad-agua). Por lo tanto, representa el costo 
adicional en que se incurrirá al hacer más restrictivos los estándares. En nuestro ejemplo, es intere- 
sante que el precio anticipado mayor, -$440/Ac,;, se da para uno de los cambios de estándar (es 
decir, corriente abajo desde la ciudad 3) que se están contemplando. Lo anterior advierte que nuestra 
modificación será costosa. 


Microsoft Excel 11.0 Reporte de sensibilidad 
Hoja: [Sec1602.xIs]Hoja1 
Reporte elaborado: 3/28/2005 11:37:39 PM 


Celdas ajustables 


Celda Nombre Disminución 
$C$4 0.00 
$C$5 0.00 
$C$6 0.00 


$C$7 10000.00 


Restricciones 


Figura 16.7 Multiplicadores 
E aijaje de Lagrange 
Reporte de la sensibilidad en una 0.00 
hoja de cálculo para evaluar el costo -30.00 
del tratamiento de residuos en un -440.00 


sistema de ríos regulado. SES7_ cono 0 0 0 08B—>> >» 00m 


Esto se confirma cuando se vuelve a ejecutar el Solver con los nuevos estándares (es decir, se 
disminuye el valor en las celdas G6 y G7 a 10). Como se muestra en la tabla 16.3, el resultado es que 


16.3 Máxima transferencia de potencia en un circuito (ingeniería eléctrica) 


el costo del tratamiento aumentó de $12600/día a $19640/día. Además, al reducir el estándar de 
concentraciones para las llegadas inferiores significará que la ciudad 4 debe comenzar a tratar sus 
desechos, y que la ciudad 3 debe actualizar su tratamiento. Note también que no se afecta el trata- 
miento en las ciudades corriente arriba. 


Tabla 16.3 Comparación de dos escenarios que muestran el impacto de diferentes 
regulaciones sobre los costos de tratamiento. 


Escenario 1: Todas las c, = 20 Escenario 2: Corriente abajo c, = 10 
Ciudad x Cc Ciudad x Cc 
1 0.8 20 1 0.8 20 
2 0.5 20 2 0.5 20 
3 0.5625 20 3 0.8375 10 
4 0 15.28 4 0.264 10 
Costo = $12 600 Costo = $19640 
40 
Potencia 
PR) a 
R; R, 2 
MW A 1 
+ 
v O = R; Ra 0 
- 0 50 100 R, 
2 
Figura 16.9 
Figura 16.8 Una gráfica de transferencia de potencia a través de 
Un circuito de resistencias con un las terminales 1-2 de la figura 16.8, como una fun- 
resistor ajustable o potenciómetro. ción de la resistencia del potenciómetro R.. 


16.3 MÁXIMA TRANSFERENCIA DE POTENCIA EN UN CIRCUITO 
(INGENIERÍA ELÉCTRICA) 


Antecedentes El circuito de resistencias simple que se presenta en la figura 16.8 contiene tres 
resistores fijos y uno variable. Los resistores variables se llaman potenciómetros. Los valores de los 
parámetros son V=80 V, R,=8 Q,R,=12 Q y R;= 10 0. a) Encuentre el valor de la resistencia 
variable R, que maximiza la transferencia de potencia a través de las terminales 1 y 2. b) Realice un 
análisis de sensibilidad para determinar cómo varían la máxima potencia y el valor correspondien- 
te del potenciómetro (R,,) conforme V varía en un rango de 45 a 105 V. 


Solución A partir de las leyes de Kirchhoff es posible obtener una expresión para la potencia del 
circuito: 


VR,R, 


R(R,+R+R)+RR,+RR 
P(R,)= Ll a 2 2 34 EA (16.11) 


a 


Sustituyendo los valores de los parámetros se obtiene la gráfica mostrada en la figura 16.9. Observe 
que la máxima transferencia de potencia se presenta con una resistencia de aproximadamente 16 Q. 
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Figura 16.10 


Determinación en Excel de la máxima 
potencia a través de un potenciómetro 
mediante el uso de prueba y error. 
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Resolveremos este problema de dos formas con la hoja de cálculo Excel. Primero, se emplean 
prueba y error y la opción Solver. Después, se desarrollará un programa macro en Visual BASIC, 
para realizar un análisis de sensibilidad. 

a) En la figura 16.10 se muestra una hoja de cálculo de Excel para implementar la ecuación 
(16.11). Como se indica, la ecuación (16.11) se introduce en la celda B9. Entonces el valor de R, (cel- 
da B8) se varía en forma de prueba y error hasta que se obtenga un residuo mínimo. En este ejemplo, 
el resultado es una potencia de 30.03 W con un valor en el potenciómetro de R, = 16.44 (2. 


1 
2 
3 V 80 
4 |Res1 8 
5 |Res2 12 
6 |Res3 10 
Y 
8 ¡Ra 16.444444 


Un procedimiento mejor consiste en utilizar la opción Solver del menú Tools (Herramientas) de 
la hoja de cálculo. Se desplegará una ventana de diálogo solicitándole la información pertinente. Las 
celdas correspondientes para el cuadro de diálogo Solver se llenarán así 


Ubique la celda destino: B9 


Igual a O máx O mín O iguala | O 


Por cambio de celdas B8 


Cuando se selecciona el botón OK (aceptar), se despliega un cuadro de diálogo con un reporte sobre 
el éxito de la operación. En el caso actual, Solver obtiene la misma solución correcta que se presen- 
ta en la figura 16.10. 

b) Ahora, aunque el procedimiento anterior es excelente para una sola evaluación, no es conve- 
niente para los casos donde se emplean múltiples optimizaciones. Tal podría ser el caso en la segun- 
da parte de esta aplicación, en la cual estamos interesados en determinar de qué modo la máxima 
potencia varía con diferentes valores de voltaje. En efecto, se podría llamar muchas veces el Solver 
con los diferentes valores de los parámetros; pero esto resultaría ineficiente. Sería preferible desa- 
rrollar una función macro que encuentre el óptimo. 

Tal función se muestra en la figura 16.11. Advierta su similitud con el pseudocódigo de la bús- 
queda de la sección dorada que se presentó en la figura 13.5. Además, observe que una función se 
debe definir también para calcular la potencia de acuerdo con la ecuación (16.11). 

En la figura 16.12 se muestra una hoja de cálculo Excel que utiliza este macro para evaluar la 
sensibilidad de la solución al voltaje. Se tiene una columna de valores que cubre los valores de los 
voltajes (es decir, de 45 a 105 V). En la celda B9 se tiene una función macro que referencia el valor 
adyacente de V (los 45 voltios en A9). Además, se dan también los otros parámetros en el argumen- 
to de la función. Advierta que, mientras la referencia a V es relativa, las referencias a los valores 
iniciales superior e inferior y a las resistencias son absolutas (es decir, incluyen el signo $). Esto se 
hizo de tal forma que cuando la fórmula se copie abajo, las referencias absolutas queden fijas; mien- 
tras que la referencia relativa corresponda al voltaje en el mismo renglón. Una estrategia similar se 
usa para introducir la ecuación (16.11) en la celda C9. 

Cuando se copian las fórmulas hacia abajo, el resultado es como el que se presenta en la figura 
16.12. La máxima potencia se puede graficar para visualizar el impacto de las variaciones de volta- 
je. En la figura 16.13 se observa que la potencia aumenta con el voltaje. 

Los resultados de los valores correspondientes en el potenciómetro (R,) son más interesantes. 
La hoja de cálculo indica que para un mismo valor, 16.44 (2, da una máxima potencia. Tal resultado 
podría ser difícil de intuir basándose en una inspección de la ecuación (16.11). 
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Option Explicit 


Function Golden (xl1low, xhigh, R1, R2, R3, V) 

Dim iter As Integer, maxit As Integer, ea As Double, es As Double 
Dim fx As Double, xL As Double, xU As Double, d As Double, x1 as Double 
Dim x2 As Double, f1 As Double, f2 As Double, xopt As Double 
Const R As Double = (5 ”* 0.5 -— 1) / 2 

maxit = 50 

es = 0.001 

xL = xlow 

xU = xhigh 

iter = 1 

d=R* (xU- xL) 

x1l =xLv+«d 

x2 = xU-d 

f1 = f(x1, Rl, R2, R3, V) 

f2. = £(x2, RL, R2, R3, V) 

If f1 > f2 Then 


xopt = xl 
fx = fl 
Else 
xXopt = x2 
fx = f2 
End If 
Do 
d=R*d 
If f1l > £2 Then 
XL = x2 
x2 = x1 
x1l= xLzv+d 
f2 = £l 
f1l = f(x1, R1l, R2, R3, V) 
Else 
xU x1 
xl = x2 
x2= xU-d 
f1l = f2 
f2 = f(x2, Rl, R2, R3, V) 
End If 


iter = iter + 1 
If f1l > £2 Then 
xopt = xl 
fx =f1 
Else 
xopt = x2 
fx = f2 
End If 
Tf xopt <> 0 Then ea = (1 — R) * Abs((xU - xL) / xopt) * 100 
If ea <= es Or iter >= maxit Then Exit Do 
Loop 
Golden = xopt 
End Function 


Function f(Ra, R1, R2, R3, V) 
f = (V*R3 * Ra / (R1* (Ra+ R2 + R3) + R3 * Ra + R3 * R2)) ? 2 / Ra 
End Function 


Figura 16.11 


Macro para Excel escrito en Visual BASIC que determina un máximo con la búsqueda de la sección 
dorada. 
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Figura 16.12 

Hoja de cálculo de Excel para implementar un 
análisis de sensibilidad de la máxima potencia 
con variaciones de voltaje. Esta rutina accesa el 
programa macro para la búsqueda de la sección 
dorada de la figura 16.11. 
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= (A9*$B$5*B9/($B$3*(B9+$B$4+$B$5)+5B$5*B9+$B$3*$B$4))"2/B9 


16.4 EQUILIBRIO Y ENERGÍA POTENCIAL MÍNIMA 


A B c D Llama a la función macro 
1 Máxima transferencia de potencia hecha en Visual BASIC 
2 
3 R1 8 = Golden($B$6,$B$7,5B$3,$B$4,5B$5,A9) 
4 R2 12 
5 R3 10 
6 Rmín 0.1 
7 Rmáx 100 
8 V Ra P(Ra) 
9 45 16.44444 9.501689 
10 60 16,44444 16.89189 
11 15 16.44444 26.39358 SS 
12 90 16.44444 38.00676 
13 105 16.44444 51.73142 Cálculo de la potencia 


(INGENIERÍA MECÁNICA/AEROESPACIAL) 


Antecedentes Como en la figura 16.14a, se puede fijar a una pared un resorte sin carga. Cuan- 
do se aplica una fuerza horizontal, el resorte se estira. El desplazamiento está relacionado con la 
fuerza por la ley de Hooke: F = kx. La energía potencial del desplazamiento consiste en la diferen- 
cia entre la energía de tensión del resorte y el trabajo realizado por la fuerza, 


PE (x) =0.5kx*— Fx (16.12) 


La ecuación (16.12) define una parábola. Como la energía potencial estará en un mínimo en el 
equilibrio, la solución para hallar el desplazamiento se puede ver como un problema de optimización 
unidimensional. Como la ecuación es tan fácil de diferenciar, se puede despejar el desplazamiento 
con x = F/k. Por ejemplo, si k =2 N/cm y F=5 N, x=5 N/(Q N/cm)y/5 = 2.5 cm. 

En la figura 16.15 se muestra un caso bidimensional más interesante. En este sistema, hay dos 
grados de libertad porque el sistema se puede mover tanto horizontal como verticalmente. Del mis- 
mo modo que en el que se trató el sistema unidimensional, las deformaciones en el equilibrio son los 
valores de x, y x, que minimizan la energía potencial, 


2 
PE(x1,x2) =0.5Kka (y pn + (La — x2)? == L.) 
2 
+ 0.5Kk (Y + (Lj + x2)? — Ls) — Fix — F2x2 


Si los parámetros son k, = 9 N/cm, k, = 2 N/cm, £, = 10 cm, £, = 10 cm, F,=2 N y F,=4N, des- 
peje los desplazamientos y la energía potencial. 


(16.13) 


Figura 16.13 


Resultados del análisis de sensibili- 
dad del efecto de las variaciones de 
voltaje sobre la máxima potencia. 


Figura 16.14 — 
a) Un resorte sin carga fijado a 
una pared. b) La aplicación de 
una fuerza horizontal estira el 
resorte, donde la relación entre 
fuerza y desplazamiento se des- 
cribe por la ley de Hooke. 


b) 


a) 


Figura 16.15 
Un sistema de dos resortes: 
a) sin carga y b) con carga. 
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Antecedentes Se pueden usar diversas herramientas de software para resolver este problema. 
Por ejemplo, usando MATLAB se puede desarrollar un archivo M que contenga la función de ener- 
gía potencial, 


function p=PE(x,ka,kb,La,Lb,F1,F2) 
PEa=0.5*ka* (sqrt (x (1)*2+ (La-x (2))*2)-La)?2; 
PEb=0.5*kb* (sqrt (x (1) *2+ (Lo+x(2))*%2)-Lb)2; 
W=F1*x (1)+F2*x (2); 

p=PEa+PEb-W; 


La solución se puede entonces obtener con la función fminsearch 


>> ka=9;kb=2;La=10;Lb=10;F1=2;F2=4; 

>> [x,f]=fminsearch(tPE, [-0.5,0.5]1,[],ka,kb,La, Lb,F1,F2) 
Xx 
.9523 1.2769 


Mol 


f 
9.6422 


Así, en el equilibrio, la energía potencial es -9.6422 N - cm. El punto de conexión está ubicado 4.9523 
cm a la derecha y 1.2759 cm arriba de su posición original. 


PROBLEMAS 
Ingeniería química/bioingeniería Tapa ze 
16.1 Diseñe el contenedor cilíndrico óptimo (figura P16.1) de tal 
forma que abra por un extremo y tenga paredes de espesor desprecia- 
ble. El contenedor va a almacenar 0.5 m', Realice el diseño de tal 
forma que el área del fondo y de sus lados sean mínimos. A 
Abierto 7 
Figura P16.2 
Un contenedor cónico con tapa. 
o a b) Repita el inciso a), pero agregue la restricción L > 2h. 
AAA AA 
Figura P16.1 A 
Un contenedor cilíndrico sin tapa. 


16.2 a) Diseñe el contenedor cónico óptimo (figura P16.2) que 

tenga tapa y paredes de espesor despreciable. El contenedor debe 

tener un volumen de 0.5 m'. Diséñelo de tal manera que las áreas 

de su tapa y lados se minimicen. b) Repita a), pero para un contenedor 

cónico sin tapa. 

16.3 Diseñe el tanque cilíndrico óptimo con extremos convexos 

(figura P16.3). El contenedor debe tener capacidad de 0.5 m' y pa- 

redes de espesor despreciable. Observe que el área y el volumen de Figura P16.3 
cada uno de los extremos convexos se puede calcular con 


A=x(h+r) V= h(h? + 312) 16.4 La razón de crecimiento específico de una levadura que produ- 
6 ce un antibiótico es una función de la concentración del alimento c, 
2c 


a) Diseñe el tanque de modo que su área superficial se minimice. a 
g 2 3 
Interprete el resultado. 4+0.8c+c"+0.2c 
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Como se ilustra en la figura P16.4, el crecimiento parte de cero a 
muy bajas concentraciones debido a la limitación de la comida. 
También parte de cero en altas concentraciones debido a los efectos 
de toxicidad. Encuentre el valor de c para el cual el crecimiento es 
un máximo. 


Figura P16.4 
La razón de crecimiento específico de una levadura que produ- 
ce un antibiótico contra la concentración de alimento. 


16.5 Una planta química elabora sus tres productos principales en 
una semana. Cada uno de estos productos requiere cierta cantidad de 
materia prima química y de diferentes tiempos de producción, obte- 
niéndose distintas utilidades. La información necesaria se resume en 
la tabla P16.5. Observe que hay suficiente espacio en la bodega de 
la planta para almacenar un total de 450 kg/semana. 

a) Establezca un problema de programación lineal para maximizar 
las utilidades. 

b) Resuelva el problema de programación lineal con el método 
simplex. 

c) Resuelva el problema con un paquete de software. 

d) Evalúe cuál de las siguientes opciones aumentará más las utili- 
dades: incrementar la materia prima, el tiempo de producción o 
el almacenaje. 

16.6 Recientemente los ingenieros químicos se han interesado en el 
área conocida como minimización de desechos. Ésta considera la 
operación de una planta química de modo tal que se minimicen los 
impactos sobre el ambiente. Suponga que una refinería desarrolla un 
producto, Z1, hecho de dos materias primas X y Y La producción de 
1 tonelada métrica del producto requiere 1 tonelada de X y 2.5 tone- 
ladas de Y y produce 1 tonelada de un líquido de desecho, W. Los 
ingenieros tienen tres alternativas para los desechos: 
+ Producir una tonelada de un producto secundario, Z2, al agregar 
una tonelada más de X por cada tonelada de W. 
* Producir una tonelada de otro producto secundario, Z3, al agre- 
gar 1 tonelada más de Y por cada tonelada de W. 
+ Tratar los desechos de tal forma que su descarga sea permisible. 
Los productos dan utilidades de $2 500, -$50 y $200/tonelada de Z1, 
Z2 y Z3, respectivamente. Observe que al producir Z2, de hecho, se 
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obtiene una pérdida. El costo del proceso de tratamiento es de $300/ 
tonelada. Además, la compañía tiene un límite de 7500 y 10000 
toneladas de X y Y, respectivamente, durante el periodo de producción. 
Determine qué cantidad de productos y desechos se deben producir 
para maximizar las utilidades. 

16.7 Hay que separar una mezcla de benceno y tolueno en un reactor 
flash. ¿A qué temperatura deberá operarse el reactor para obtener la 
mayor pureza de tolueno en la fase líquida (maximizar xy)? La presión 
en el reactor es de 800 mm Hg. Las unidades en la ecuación de An- 
toine son mm Hg y *C para presión y temperatura, respectivamente. 


XP, EXP, = P 
1211 
1 P. )=6.905-— 
0810 (Pe, ) T+4221 
1 344 
1 P. )=6.953-— 
oE10(Pa) T+219 


16.8 A se convertirá en B en un reactor con agitación. El producto 
B y la sustancia sin reaccionar A se purifican en una unidad de sepa- 
ración. La sustancia A que no entró en la reacción se recicla al reac- 
tor. Un ingeniero de procesos ha encontrado que el costo inicial del 
sistema es una función de la conversión, x,. Encuentre la conversión 
que dará el sistema de menor costo. C es una constante de propor- 
cionalidad. 


1 0.6 1 0.6 
Costo = C||-——— +02) 
(5 ) Xi 


16.9 En el problema 16.8 se utiliza sólo un reactor. Si se usan dos 
reactores en serie, cambia la ecuación que rige el sistema. Encuentre 
las conversiones en ambos reactores (Xy, Y X12), de forma que se 
minimicen los costos totales del sistema. 


Costo = 


0.6 
Xar ) + 
Xp2 (1 = dl 


16.10 En la reacción: 


2A+B SC 
el equilibrio se expresa como: 


[C] [C] 
K= 2 => 2 
[AJ[B]  [4,-2C1'[B, -C] 


Si K=2 M”, se puede modificar la concentración inicial de A (4). 
La concentración inicial de B se fija por el proceso, B, = 100. A 


Tabla P16.5 
Disponibilidad 
Producto 1 Producto 2 Producto 3 de fuentes 
Materia prima química 6 kg/kg 4 kg/kg 13 kg/kg 3000 kg 
Tiempo de producción 0.05 h/kg 0.1 h/kg 0.2 h/kg 55 h/semana 
$30/kg 


Utilidad 


$30/kg 


$35/kg 


cuesta $1/M y C se vende a $10/M. ¿Cuál será la concentración 
inicial Óptima de A que habrá de usarse de manera que se maximicen 
las utilidades? 

16.11 Una planta química necesita 10% L/día de una solución. Se 
tienen tres fuentes con diferentes tasas de precios y suministros. Cada 
fuente tiene también concentraciones diferentes de una impureza que 
no debe rebasar cierto nivel, para evitar interferencias con las sus- 
tancias químicas. Los datos de las tres fuentes se resumen en la tabla 
siguiente. Determine la cantidad de cada fuente que satisfaga los 
requerimientos al menor costo. 


Fuente 1 Fuente 2 Fuente 3 Requerimiento 
Costo ($/L) 0.50 1.00 1.20 minimizar 
Suministro (10? Udía) 20 10 5 =10 
Concentración (mg/L) 135 100 75 =100 


16.12 Usted tiene que diseñar un canal triangular abierto para trans- 
portar una corriente de desechos desde una planta química hasta un 
depósito de estabilización de desechos (figura P16.12). La velocidad 
media aumenta con el radio hidráulico, R, =A/p, donde A es el área de 
la sección transversal y P es igual al perímetro mojado. Como la razón 
de flujo máximo corresponde a la velocidad máxima, el diseño óptimo 
tratará de minimizar el perímetro mojado. Determine las dimensiones 
que minimicen el perímetro mojado para un área dada de la sección 
transversal. ¿Las dimensiones están dentro de las medidas estándar? 


Figura P16.12 


16.13 Un ingeniero agrícola tiene que diseñar un canal trapezoidal 
abierto para transportar el agua para irrigación (figura P16.13). De- 
termine las dimensiones óptimas para minimizar el perímetro moja- 
do en un área de sección transversal de 100 m?. ¿Las dimensiones 
están dentro de las medidas estándar? 


- w > 


Figura P16.13 


16.14 Calcule las dimensiones óptimas para un tanque cilíndrico 
térmico diseñado para contener 10 m? de fluido. Los extremos y late- 
rales cuestan $200/m? y $100/m?, respectivamente. Además, se aplica 
un recubrimiento a toda el área del tanque, la cual cuesta $50/m?. 
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Ingeniería civil/ambiental 

16.15 Si se optimiza la ecuación siguiente se obtiene un modelo de 
elemento finito para una viga volada sujeta a cargas y momentos 
(figura P16.15) 


Jr y) = 5 -5xy + 2.5) —x- 1.5y 


donde x = desplazamiento final y y = momento final. Calcule los 
valores de x y y que minimizan Ax, y). 


Figura P16.15 
Viga volada. 


16.16 Suponga usted que se le pide diseñar una columna que so- 
porte una carga de compresión P, como se muestra en la figura 
P16.16a. La columna tiene una sección transversal en forma de tubo 
de pared delgada, como se aprecia en la figura P16.16b. 

Las variables de diseño son el diámetro medio del tubo d y el 
espesor de la pared £. El costo del tubo se calcula por medio de la 
ecuación 


Costo = ft, d) = c,W+ cad 
donde c, =4 y c,=2 son los factores de costo y W = peso del tubo, 
W=x1 dt Hp 


donde p = densidad del material del tubo = 0.0025 kg/cm'. La co- 
lumna debe dar apoyo a la carga bajo un esfuerzo de compresión sin 
flexionarse. Por lo tanto, 


Esfuerzo real (0) € esfuerzo máximo de compresión 


=0,= 550 kg/cm? 


a) b) 


Figura P16.16 

a) Una columna que soporta una carga de compresión P. 

b) La columna tiene una sección transversal en forma de tubo 
de pared delgada. 
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Esfuerzo real < esfuerzo de flexión 


El esfuerzo real está dado por 


_P_ 2 
A mdf 


Se puede demostrar que el esfuerzo de flexión es 


TEL 
0,== 
H"dt 


donde E = módulo de elasticidad e / = segundo momento del área 
de la sección transversal. Con cálculo se muestra que 


I= AUS +1) 


Por último, los diámetros de los tubos disponibles se encuentran 
entre d, y d,, y el espesor está entre £, y £,, Desarrolle y resuelva este 
problema con la determinación de los valores de d y t que minimizan 
el costo. Obsérvese que H = 275 cm, P=2000kg, E = 900000 kg/ 
em?, d, = 1 cm, d,=10 cm, ft, =0.1 cm y f,= 1cm. 

16.17 El modelo Streeter-Phelps se utiliza para calcular la concen- 
tración de oxígeno disuelto en un río aguas abajo del punto de des- 
carga de un drenaje (véase la figura P16.17), 


KyL, 
O; 
" Ka + K, = K, 


(P.16.17) 


(et e tarnr, > (1 et) 


a 


donde o = concentración del oxígeno disuelto [mg/L], o, = concentra- 
ción de saturación del oxígeno [mg/L], £= tiempo de travesía [d], L, = 
concentración de la demanda bioquímica de oxígeno (DOB) en el 
punto de mezcla [mg/L], k,,=razón de descomposición de DOB [d”'], 
k, = razón de asentamiento de DBO [d”'], k, = razón de oxigenación 
[d”*] y S, = demanda de oxígeno sedimentario [mg/L/d]. 

Como se indica en la figura P16.17, la ecuación (P16.17) produ- 
ce un “decaimiento” de oxígeno que alcanza un nivel mínimo crítico 
O, para cierto tiempo de travesía £, abajo del punto de descarga. Este 
punto se denomina “crítico” porque representa la ubicación en que 
la biota (flora y fauna) que depende del oxígeno (como los peces) 
estaría sujeta a la amenaza máxima. Determine el tiempo de travesía 
y la concentración críticos, dados los valores siguientes: 


o,= 10 mg/L 
k,=0.05 d* 


k¿=0.1 d” 
L, = 50 mg/L 


k,=0.6 d* 
S, = 1 mg/L/d 


0 0 0 0 0 0 0 00 0 | UA 1 0] 


| 
0 5 10 15 20 
t(d) 


Figura P16.17 
Un “decaimiento” de oxígeno disuelto debajo del punto de 
descarga de un drenaje hacia un río. 


Estudio de casos: optimización 


16.18 La distribución bidimensional de la concentración de cierto 
contaminante en un canal está descrita por la ecuación 


c(x, y) =7.9 + 0.13x + 0.21y — 0.052 
-0.016y? — 0.007xy 


Determine la ubicación exacta de la concentración máxima dada la 
función, si se sabe que se encuentra entre los límites de -10<x<10 
y0<y<20. 

16.19 El flujo Q [m*/s] en un canal abierto se pronostica con la 
ecuación de Manning 


1 
=24 Rs" 
Bea 


donde n= coeficiente de rugosidad de Manning (número adimensio- 
nal que se usa para parametrizar la fricción en el canal), A, = área de 
la sección transversal del canal (m2), S = pendiente del canal (adi- 
mensional, metros en vertical por metros en horizontal) y R = radio 
hidráulico (m), el cual está relacionado con otros parámetros más por 
R=A.,/P, donde P = perímetro mojado (m). Como su nombre lo dice, 
el perímetro mojado es la longitud de los lados y fondo del canal que 
están bajo el agua. Por ejemplo, para un canal rectangular, se define 
como P = B + 2H, donde A = profundidad (m). Suponga que se uti- 
liza esta fórmula para diseñar un canal recubierto (observe que los 
granjeros usan canales recubiertos para minimizar las pérdidas por 
fugas). 

a) Dados los parámetros n = 0.035, S=0.003 y OQ = 1 m/'/s, deter- 
mine los valores de B y H que minimizan el perímetro mojado. 
Observe que dicho cálculo minimizaría el costo si los costos del 
recubrimiento fueran mucho mayores que los de excavación. 

b) Vuelva a resolver el inciso a), pero incluya el costo de exca- 
vación. Para hacer esto minimice la siguiente función de costo, 


C=cCcA,+c,P 


donde c, es un factor de costo para la excavación = $100/m? y 
c, es un factor de costo del recubrimiento de $50/m. 
c) Analice las implicaciones de los resultados. 
16.20 Una viga cilíndrica soporta una carga de compresión de P = 
3 000 kN. Para impedir que la viga se flexione (doble), la carga debe 
ser menor que la crítica, 
7 El 


c P 


donde E = módulo de Young = 200 x 10? N/m?, 7 =0r*/4 (momento 
de inercia del área para una viga cilíndrica de radio r) y L es la lon- 
gitud de la viga. Si el volumen de la viga V no puede exceder de 0.075 
m?, encuentre la altura más grande L que puede utilizarse, así como 
el radio correspondiente. 

16.21 El río Splash tiene una tasa de flujo de 2 x 10% m/'/d, de los 
cuales puede derivarse hasta el 70% hacia dos canales por los que 
fluye a través de Splish County. Estos canales se usan para el trans- 
porte, irrigación y generación de energía eléctrica, y los últimos dos 
usos son fuentes de ingresos. El uso para el transporte requiere una 
tasa de flujo derivado mínimo de 0.3 x 10% m*/d para el Canal 1 y 0.2 
x 10% m*/d para el Canal 2. Por razones políticas se decidió que la 
diferencia absoluta entre las tasas de flujo en los dos canales no ex- 
cediera de 40% del flujo total derivado hacia los canales. El Orga- 
nismo de Administración del Agua de Splish County, también ha 


limitado los costos de mantenimiento para el sistema de canales a no 
más de $1.8 x 10% por año. Los costos anuales de mantenimiento se 
estiman con base en la tasa de flujo diario. Los costos por año para 
el Canal 1 se estiman multiplicando $1.1 por los m'/d de flujo; mien- 
tras que para el Canal 2 el factor de multiplicación es de $1.4 por 
m'/d. El ingreso por la generación de energía eléctrica también se 
estima con base en la tasa de flujo diario. Para el Canal 1 ésta es de 
$4.0 por m*/d, mientras que para el Canal 2 es de $3.0 por m'/d. El 
ingreso anual por la irrigación también se estima con base en la tasa 
de flujo diario, pero primero deben corregirse las tasas de flujo por 
las pérdidas de agua en los canales antes de que se distribuya para 
irrigar. Esta pérdida es de 30% en el Canal 1 y de 20% en el Canal 
2. En ambos canales el ingreso es de $3.2 por m'/d. Determine los 
flujos en los canales que harían máxima la utilidad. 

16.22 Determine las áreas de la sección transversal de una viga que 
dan como resultado el peso mínimo para la trabe que se estudió en 
la sección 12.2 (véase la figura 12.4). Los esfuerzos de torsión 
(flexión) crítica y tensión máxima de los miembros de compresión y 
tensión son de 10 kPsi y 20 kPsi, respectivamente. La trabe va a 
construirse con acero (densidad = 3.5 Ib/pie-pulg?). Observe que la 
longitud del miembro horizontal (2) es de 50 pies. Asimismo, recuer- 
de que el esfuerzo en cada miembro es igual a la fuerza dividida 
entre el área de la sección transversal. Plantee el problema como un 
problema de programación lineal. Obtenga la solución en forma 
gráfica y con la herramienta Solver de Excel. 


Ingeniería eléctrica 

16.23 Alrededor de un conductor en forma de anillo de radio a, se 
encuentra una carga total O distribuida uniformemente. A una distancia 
x del centro del anillo (véase la figura P16.23) se localiza una carga q. 
La fuerza que el anillo ejerce sobre la carga está dada por la ecuación 


1 qQx 

Ml 4 e, (ray? 
donde e, = 8.85 x 10 CN m),q=0=2x107*C y a=0.9m. 
Determine la distancia x donde la fuerza es máxima. 


q 


Figura P16.23 


16.24 Un sistema consiste en dos plantas de energía que deben 
distribuir cargas por una red de transmisión. Los costos de generar 
la energía en las plantas 1 y 2 están dados por 

F, =2p,+2 

F,= 10p, 
donde p, y p, = energía producida en cada una de las plantas. Las 
pérdidas de energía debidas a la transmisión £ están dadas por 

L, =0.2p, +0.1p, 

L, = 0.2p, + 0.5p, 
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La demanda total de energía es de 30 y p, no debe exceder de 42. 
Determine la generación de energía necesaria para satisfacer las de- 
mandas con el costo mínimo, con el empleo de una rutina de optimi- 
zación como las que tienen, por ejemplo, Excel, software MATLAB 
o Mathcad. 

16.25 El momento de torsión transmitido a un motor de inducción 
es función del deslizamiento entre la rotación del campo del estator 
y la velocidad del rotor s, donde el deslizamiento se define como 


donde n = revoluciones por segundo de rotación de la velocidad del 
estator y n= velocidad del rotor. Pueden usarse las leyes de Kirchhoff 
para demostrar que el momento de torsión (expresado en forma 
adimensional) y el deslizamiento están relacionados por la ecuación 


_ 15(s - s?) 
—(1-NAs-—35+4) 


La figura P16.25 muestra esta función. Emplee un método numérico 
para determinar el deslizamiento con el que ocurre el momento de 
torsión máximo. 


N Y AS 


Figura P16.25 
Momento de torsión transmitido a un inductor como función 
del deslizamiento. 


16.26 

a) Un fabricante de equipo de cómputo produce escáneres e im- 
presoras. Los recursos necesarios para producirlos así como las 
utilidades correspondientes son los que siguen 


Capital Mano de obra Utilidad 
Equipo ($/unidad) (h/unidad) ($/unidad) 
Escáner 300 20 500 
Impresora 400 10 400 


Si cada día se dispone de $127000 de capital y 4270 horas de 
mano de obra, ¿qué cantidad de cada equipo debe producirse a 
diario a fin de maximizar la utilidad? 

b) Repita el problema, pero ahora suponga que la utilidad por 
cada impresora vendida P, depende del número de impresoras 
producidas X,, como en 


P,=400-X, 
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16.27 Un fabricante proporciona microcircuitos especializados. 
Durante los próximos tres meses, sus ventas, costos y tiempo dispo- 
nible son los que siguen 


Mes 1 Mes 2 Mes 3 
Circuitos requeridos 1000 2500 2200 
Costo del tiempo normal ($/circuito) 100 100 120 
Costo del tiempo extra ($/circuito) 110 120 130 
Tiempo de operación regular (h) 2400 2400 2400 
Tiempo extra (h) 720 720 720 


Al principio del primer mes no existen circuitos almacenados. Toma 
1.5 horas del tiempo de producción fabricar un circuito y cuesta $5 
almacenarlo de un mes al siguiente. Determine un programa de 
producción que satisfaga los requerimientos de la demanda, sin que 
exceda las restricciones de tiempo de producción mensual, y mini- 
mice el costo. Observe que al final de los 3 meses no debe haber 
circuitos almacenados. 


Ingeniería mecánica/aeroespacial 
16.28 El arrastre total de un aeroplano se estima por medio de 


D=0.010V? + 21m) 
oxv 
fricción empuje 


donde D = arrastre, O = razón de la densidad del aire entre la altitud 

de vuelo y el nivel del mar, W = peso y V = velocidad. Como se 

observa en la figura P16.28, los dos factores que contribuyen al 

arrastre resultan afectados en forma distinta conforme la velocidad 

aumenta. Mientras que el arrastre por fricción se incrementa con la 

velocidad, el arrastre debido al empuje disminuye. La combinación 

de los dos factores lleva a un arrastre mínimo. 

a) Sio=0.5 y W= 15000, determine el arrastre mínimo y la ve- 
locidad a la que ocurre. 

b) Además, realice un análisis de sensibilidad para determinar 
cómo varía este óptimo en respuesta a un rango de W= 12000 
a 18000 con d =0.5. 


D 
20 000 
Mínimo 
10 000 Total 
Fricción 
0 
0 400 800 1200 y 


Figura P16.28 
Gráfica de arrastre versus la velocidad de un aeroplano. 


16.29 Los baleros de rodamiento están expuestos a fallar por la fa- 
tiga ocasionada por cargas grandes de contacto F (véase la figura 
P16.29). 
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Puede demostrarse que el problema de encontrar la ubicación 
del esfuerzo máximo a lo largo del eje x es equivalente a maximizar 
la función 


. 0.4 a 0.4 Y, 
FA) J 5 +1 7 =)+ 


l+x +xX 


Encuentre el valor de x que maximiza a f(x). 


Figura P16.29 
Baleros de rodamiento. 


16.30 Una compañía aeroespacial desarrolla un aditivo nuevo para 
el combustible de aeronaves comerciales. El aditivo está compuesto 
de tres ingredientes: X, Y y Z. Para el rendimiento mayor, la cantidad 
total de aditivo debe ser al menos de 6 mL/L de combustible. Por 
razones de seguridad, la suma de los ingredientes X y Y altamente 
inflamables, no debe exceder los 2.5 mL/L. Además, la cantidad del 
ingrediente X siempre debe ser mayor o igual a la de Y, y la de Zdebe 
ser mayor que la mitad de la de Y. Si el costo por mL para los ingre- 
dientes X, Y y Zes de 0.05, 0.025 y 0.15, respectivamente, determine 
la mezcla de costo mínimo para un litro de combustible. 

16.31 Una empresa manufacturera produce cuatro tipos de partes 
automotrices. Cada una de ellas primero se fabrica y luego se le dan 
los acabados. Las horas de trabajador requeridas y la utilidad para 
cada parte son las siguientes 


Tiempo de fabricación (h/100 unidades) 25 15 275 2 
Tiempo de acabados (h/100 unidades) 3.5 3 3 2 
475 325 


Utilidad ($/100 unidades) 375 275 


Las capacidades de los talleres de fabricación y acabados para el mes 
siguiente son de 640 y 960 horas, respectivamente. Determine qué 
cantidad de cada parte debe producirse a fin de maximizar la utilidad. 
16.32 De modo similar al estudio de caso que se describe en la sec- 
ción 16.4, desarrolle la función de energía potencial para el sistema 
que se ilustra en la figura P16.32. Desarrolle gráficas de contorno y 
superficie en MATLAB. Minimice la función de energía potencial 
con el fin de determinar los desplazamientos en el equilibrio x, y x, 
dada la función de forzamiento F'= 100 N, y el parámetro k,, = 20 y 
k, = 15 N/m. 


Figura P16.32 
Dos masas sin fricción conectadas a Una pared por un par de 
resortes elásticos lineales. 


16.33 El reciente interés en el ciclismo de competencia y recreativo 
ha dado como resultado que los ingenieros dirigieran sus habilidades 
hacia el diseño y prueba de bicicletas (figura P16.33a). Suponga que 
se le ha asignado la tarea de predecir el desplazamiento horizontal y 
vertical de un sistema de armazón de bicicleta en respuesta a una 
fuerza. Suponga que las fuerzas que usted debe analizar se pueden 
simplificar como se ilustra en la figura P16.33b. Usted está interesa- 
do en probar la respuesta del tirante a una fuerza que se ejerza en 
cualquier número de direcciones designadas por el ángulo 0. Los 
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parámetros para el problema son E= módulo de Young =2 x 10" Pa, 
A = área de la sección transversal = 0.0001 n?, w = anchura = 0.44 
m, € = longitud = 0.56 m y h = altura = 0.5 m. Los desplazamientos 
x y y se pueden resolver determinando los valores que dan una ener- 
gía potencial mínima. Determine los desplazamientos para una 
fuerza de 10000 N y un rango de 6 de 0? (horizontal) a 90” (vertical). 


Figura P16.33 
a) Una bicicleta con b) un diagrama de cuerpo libre para una 
parte del marco. 


EPÍLOGO: PARTE CUATRO 


Los epílogos de las otras partes de este libro contienen un análisis y un resumen tabular de las ven- 
tajas y desventajas de los diferentes métodos, así como las fórmulas y relaciones importantes. La 
mayoría de los métodos de esta parte son complicados y, en consecuencia, no se pueden resumir en 
fórmulas simples y tablas. Por lo tanto, aquí nos desviaremos un poco para ofrecer el siguiente aná- 
lisis escrito de las alternativas y las referencias adicionales. 


PT4.4 ALTERNATIVAS 


En el capítulo 13 se trató de la búsqueda del valor óptimo de una función con una sola variable sin 
restricciones. El método de búsqueda de la sección dorada es un método cerrado que requiere de 
un intervalo que contenga un solo valor óptimo conocido. Tiene la ventaja de minimizar las eva- 
luaciones de la función, y ser siempre convergente. La interpolación parabólica funciona mejor 
cuando se implementa como un método cerrado, aunque también se puede programar como un 
método abierto. Sin embargo, en tales casos, puede diverger. Tanto el método de búsqueda de la 
sección dorada como el de interpolación parabólica no requieren evaluaciones de la derivada. Así, 
ambos son apropiados cuando el intervalo puede definirse fácilmente y las evaluaciones de la fun- 
ción son demasiadas. 

El método de Newton es un método abierto que no requiere que esté dentro de un intervalo 
óptimo. Puede implementarse en una representación de forma cerrada, cuando la primera y segunda 
derivadas se determinan en forma analítica. También se implementa en una forma similar el método 
de la secante al representar las derivadas en diferencias finitas. Aunque el método de Newton con- 
verge rápidamente cerca del óptimo, puede diverger con valores iniciales pobres. Además la conver- 
gencia depende también de la naturaleza de la función. 

Finalmente, hay enfoques híbridos disponibles que instrumentan diversos métodos para obtener 
tanto confiabilidad como eficiencia. El método de Brent hace esto combinando la confiable búsque- 
da de sección dorada con la rápida interpolación parabólica. 

En el capítulo 14 se trataron dos tipos generales de métodos para resolver problemas de optimi- 
zación sin restricciones multidimensionales. Los métodos directos como el de búsquedas aleatorias 
y el de búsquedas univariables no requieren el cálculo de las derivadas de la función y con frecuen- 
cia son ineficientes. Sin embargo, proporcionan también una herramienta para encontrar el óptimo 
global más que el local. Los métodos de búsqueda con un patrón como el método de Powell llegan 
a ser muy eficientes y tampoco requieren del cálculo de la derivada. 

Los métodos con gradiente usan la primera y, algunas veces, la segunda derivadas para encon- 
trar el óptimo. El método del mayor ascenso/descenso ofrece un procedimiento confiable pero en 
ocasiones lento. Por el contrario, el método de Newton converge con rapidez cuando se está en la 
vecindad de una raíz; pero algunas veces sufre de divergencia. El método de Marquardt utiliza el 
método de mayor descenso en la ubicación inicial, muy lejos del óptimo, y después cambia al méto- 
do de Newton cerca del óptimo, en un intento por aprovechar las fortalezas de cada método. 

El método de Newton puede ser costoso computacionalmente ya que requiere calcular tanto del 
vector gradiente como de la matriz hessiana. Los métodos cuasi-Newton intentan evitar estos pro- 
blemas al usar aproximaciones para reducir el número de evaluaciones de matrices (particularmen- 
te, la evaluación, el almacenamiento y la inversión del hessiano). 

En la actualidad, las investigaciones continúan para explorar las características y las ventajas 
correspondientes de varios métodos híbridos y en tándem. Algunos ejemplos son el método del 
gradiente conjugado de Fletcher-Reeves y los métodos cuasi-Newton de Davidon-Fletcher-Powell. 

El capítulo 15 se dedicó a la optimización con restricciones. Para problemas lineales, la progra- 
mación lineal basada en el método simplex ofrece un medio eficiente para obtener soluciones. Pro- 
cedimientos como el método GRG sirven para resolver problemas con restricciones no lineales. 

Los paquetes de software incluyen una amplia variedad de capacidades de optimización. Como 
se describe en el capítulo 15, Excel, MATLAB y Mathcad tienen, todos, capacidades interconstrui- 
das de búsqueda que se pueden usar para los problemas tanto unidimensionales como bidimensio- 
nales que se encuentran rutinariamente en la ingeniería y en la ciencia. 


PT4.5 Referencias adicionales 


PT4.5 REFERENCIAS ADICIONALES 


En Press ef al. (2007) y en Moler (2004) se pueden encontrar descripciones generales de optimiza- 
ción, incluyendo algunos algoritmos. Para problemas multidimensionales, se puede encontrar infor- 
mación adicional en Dennis y Schnabel (1996), Fletcher (1980, 1981), Gill et al. (1981) y Luenberger 
(1984). 

Además, hay varios métodos avanzados que son adecuados para contextos específicos de pro- 
blemas. Por ejemplo, los algoritmos genéticos usan estrategias inspiradas en la biología evolutiva, 
como la herencia, la mutación y la selección. Como no hacen suposiciones respecto al espacio de 
búsqueda, tales algoritmos evolutivos resultan a menudo útiles para grandes problemas con muchos 
locales óptimos. Las técnicas relacionadas con esto incluyen el recocido simulado y la búsqueda 
tabú. Hillier y Lieberman (2005) dan descripciones generales de éstas y muchas otras técnicas 
avanzadas. 
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PARTE CINCO 


EXE 


AJUSTE DE CURVAS 


PT5.1 MOTIVACIÓN 


Es común que los datos se den como valores discretos a lo largo de un continuo. Sin embargo, quizás 
usted requiera la estimación de un punto entre valores discretos. Esta parte del libro describe las 
técnicas para ajustar curvas a estos datos para obtener estimaciones intermedias. Además, usted 
puede necesitar la versión simplificada de una función complicada. Una manera de hacerlo es calcu- 
lar valores de la función en un número discreto de valores en el intervalo de interés. Después, se 
obtiene una función más simple para ajustar dichos valores. Estas dos aplicaciones se conocen como 
ajuste de curvas. 

Existen dos métodos generales para el ajuste de curvas que se distinguen entre sí al considerar 
la cantidad de error asociado con los datos. Primero, si los datos exhiben un grado significativo de 
error o “ruido”, la estrategia será obtener una sola curva que represente la tendencia general de los 
datos. Como cualquier dato individual puede ser incorrecto, no se busca intersecar todos los puntos. 
En lugar de esto, se construye una curva que siga la tendencia de los puntos tomados como un grupo. 
Un procedimiento de este tipo se llama regresión por mínimos cuadrados (figura PT5.1a). 

Segundo, si se sabe que los datos son muy precisos, el procedimiento básico será colocar una 
curva o una serie de curvas que pasen por cada uno de los puntos en forma directa. Usualmente 
tales datos provienen de tablas. Como ejemplos se tienen los valores de la densidad del agua o la 
capacidad calorífica de los gases en función de la temperatura. La estimación de valores entre pun- 
tos discretos bien conocidos se llama interpolación (figuras PTS.1b y PT5.1c). 


PT5.1.1 Métodos sin computadora para el ajuste de curvas 


El método más simple para ajustar una curva a los datos consiste en ubicar los puntos y después 
trazar una curva que visualmente se acerque a los datos. Aunque ésta es una operación válida cuan- 
do se requiere una estimación rápida, los resultados dependen del punto de vista subjetivo de la 
persona que dibuja la curva. 

Por ejemplo, en la figura PT5.1 se muestran curvas trazadas a partir del mismo conjunto de 
datos por tres ingenieros. El primero no intentó unir los puntos, sino, más bien, caracterizar la ten- 
dencia general ascendente de los datos con una línea recta (figura PT5.1a). El segundo ingeniero usó 
segmentos de línea recta o interpolación lineal para unir los puntos (figura PT5.1b). Ésta es una 
práctica común en la ingeniería. Si los valores se encuentran cercanos a ser lineales o están cerca- 
namente espaciados, tal aproximación ofrece estimaciones que son adecuadas en muchos cálculos 
de ingeniería. No obstante, si la relación es altamente curvilínea o los datos están muy espaciados, 
es posible introducir errores mediante esa interpolación lineal. El tercer ingeniero utiliza curvas 
suaves para tratar de capturar el serpenteado sugerido por los datos (figura PT3.1c). Un cuarto o 
quinto ingeniero podría, de igual forma, desarrollar ajustes alternativos. Obviamente, nuestra meta 
aquí es desarrollar métodos sistemáticos y objetivos con el propósito de obtener tales curvas. 


PT5.1.2 Ajuste de curvas y práctica en ingeniería 


Su primer encuentro con el ajuste de curvas podría haber sido determinar valores intermedios a 
partir de datos tabulados (por ejemplo, tablas de interés para ingeniería económica, o tablas de vapor 
en termodinámica). En lo que resta de su carrera, usted tendrá frecuentes oportunidades para estimar 
valores intermedios a partir de tablas. 

Aunque se han tabulado muchas propiedades ampliamente utilizadas en la ingeniería, existen 
otras que no están disponibles en esta forma conveniente. Los casos especiales y nuevos contextos 
de problemas requieren que usted recolecte sus propios datos y desarrolle sus propias relaciones 
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predictivas. Se han encontrado dos tipos de aplicaciones en el ajuste de datos 


x variable dependiente. Esto puede implicar una extrapolación más allá de los 


de) experimentales: análisis de la tendencia y prueba de hipótesis. 
0 El análisis de la tendencia representa el proceso de utilizar el compor- 
tamiento de los datos para realizar predicciones. En casos donde los datos 
o son medidas de alta precisión, se usan polinomios de interpolación. Los 
datos imprecisos se analizan mediante una regresión por mínimos cuadrados. 
El análisis de la tendencia sirve para predecir o pronosticar valores de la 
> 
a) 


límites de los datos observados o una interpolación dentro del intervalo de 
los datos. Por lo común, en todos los campos de la ingeniería se presentan 


Por otro lado, si ya se dispone de la estimación de los coeficientes del mo- 


b) 


x delo sería conveniente comparar los valores predichos del modelo con los 
observados para probar qué tan adecuado es el modelo. Con frecuencia, se 
comparan modelos alternativos y se elige “el mejor” considerando las obser- 


Xx 
el vaciones hechas en forma empírica. 

Además de las aplicaciones mencionadas en la ingeniería, el ajuste de 
curvas es importante para implementar otros métodos numéricos, como la 
integración y la solución aproximada de ecuaciones diferenciales. Por úl- 
timo, las técnicas de ajuste de curvas son útiles para obtener funciones simples 


ía problemas de este tipo. 

Una segunda aplicación del ajuste de curvas experimental en ingeniería 
es la prueba de hipótesis. Aquí, un modelo matemático existente se compa- 
ra con los datos obtenidos. Si se desconocen los coeficientes del modelo, será 
necesario determinar los valores que mejor se ajusten a los datos observados. 


con la finalidad de aproximar funciones complicadas. 


> 
xXx 


c) 
PT5.2 ANTECEDENTES MATEMÁTICOS 
Figura PT5.1 ' : , 
Tres intentos para ajustar una “mejor” curva Los fundamentos matemáticos de la interpolación se encuentran en el cono- 
con cinco puntos dados. a) Regresión por cimiento sobre las expansiones de la serie de Taylor y las diferencias finitas 
mínimos cuadrados, b) interpolación lineal y divididas que se presentaron en el capítulo 4. La regresión por mínimos 


Cc) interpolación curvilínea. 


cuadrados requiere además de la información en el campo de la estadística. 

Si usted conoce los conceptos de la media, desviación estándar, suma del 

cuadrado de los residuales, distribución normal e intervalos de confianza, 

puede omitir el estudio de las siguientes páginas y pasar directamente a la 
sección PT5.3. Si no recuerda muy bien estos conceptos o necesita de un repaso, el estudio del si- 
guiente material le servirá como introducción a esos temas. 


PT5.2.1 Estadística simple 


Suponga que en el curso de un estudio de ingeniería se realizaron varias mediciones de una cantidad 
específica. Por ejemplo, la tabla PT5.1 contiene 24 lecturas del coeficiente de expansión térmica del 
acero. Tomados así, los datos ofrecen una información limitada (es decir, que los valores tienen un 
mínimo de 6.395 y un máximo de 6.775). Se obtiene una mayor comprensión al analizar los datos 
mediante uno o más estadísticos, bien seleccionados, que den tanta información como sea posible 
acerca de las características específicas del conjunto de datos. Esos estadísticos descriptivos se se- 
leccionan para representar 1) la posición del centro de la distribución de los datos y 2) el grado de 
dispersión de los datos. 

El estadístico de posición más común es la media aritmética. La media aritmética (y) de una 
muestra se define como la suma de los datos (y;) dividida entre el número de datos (n), o 


za (PT5.1) 


PT5.2 Antecedentes matemáticos 


donde la sumatoria (y todas las sumatorias que siguen en esta introducción) va desde ¡= 1 hasta n. 
La medida de dispersión más común para una muestra es la desviación estándar (s,) respecto 
de la media, 


a > (PT5.2) 
5 n—-1 
donde S, es la suma total de los cuadrados de las diferencias entre los datos y la media, o 
S,=%0, -yY (PT5.3) 


Así, si las mediciones se encuentran muy dispersas alrededor de la media, S, (y, en consecuencia, s,) 
será grande. Si están agrupadas cerca de ella, la desviación estándar será pequeña. La dispersión 
también se puede representar por el cuadrado de la desviación estándar, llamada la varianza: 


SÓ 
ia 20: -— y) (PT5.4) 
» n-1 


Observe que el denominador en ambas ecuaciones (PT5.2) y (PT5.4) es n— 1. La cantidad n — 1 se 
conoce como los grados de libertad. Por lo tanto, se dice que $, y s, consideran n — 1 grados de li- 
bertad. Esta nomenclatura se obtiene del hecho de que la suma de las cantidades sobre las cuales se 
basa S, (es decir, Y — y¡, Y — Y», ...» Y — y, ) es cero. En consecuencia, si se conoce y y se especifican 
los valores de n — 1, el valor restante queda determinado. Así, sólo n — 1 de los valores se dice que 
se determinan libremente. Otra justificación para dividir entre n — 1 es el hecho de que no tiene 
sentido hablar de la dispersión de un solo dato. Cuando n = 1, las ecuaciones (PT5.2) y (PT5.4) dan 
un resultado sin sentido: infinito. 

Se deberá observar que hay otra fórmula alternativa más conveniente, para calcular la desviación 
estándar, 


E Xy; -(2y) Un 


n-1 


Esta versión no requiere el cálculo previo de y y se obtiene el mismo resultado que con la ecuación 
(PT5.4). 

Un estadístico final que tiene utilidad para cuantificar la dispersión de los datos es el coeficien- 
te de variación (c.v.). Tal estadístico es el cociente de la desviación estándar entre la media. De esta 
manera, proporciona una medición normalizada de la dispersión. Con frecuencia se multiplica por 
100 para expresarlo como porcentaje: 


c.v.=2-100% (PT5.5) 
y 


Observe que el coeficiente de variación tiene un carácter similar al del error relativo porcentual (e,) 
analizado en la sección 3.3. Es decir, éste es la razón de una medición de error (s,) respecto a un 
estimado del valor verdadero (y). 


Tabla PT5.1 Mediciones del coeficiente de expansión térmica del acero 
[x 10% in/(in - *F)]. 


6.495 6.595 6.615 6.635 6.485 6.555 


6.665 6.505 6.435 6.625 6.715 6.655 
6.755 6.625 6.715 6.575 6.655 6.605 


6.565 6.515 6.555 6.395 6.775 6.685 
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EJEMPLO PT5.1 Estadística simple de una muestra 


Planteamiento del problema Calcule la media, la varianza, la desviación estándar y el coefi- 
ciente de variación para los datos de la tabla PTS5.1. 


Solución Se suman los datos (tabla PT5.2) y los resultados sirven para calcular [ecuación (PT5.1)] 


158.4 — 


——=6.6 
24 


y = 


Como se observa en la tabla PT5.2, la suma de los cuadrados de las diferencias es 0.217000, los 
cuales se usan para calcular la desviación estándar [ecuación (PT5.2)]: 


s,= pain > 0.097133 
24-1 


la varianza [ecuación (PT5.4)]: 


s, =0.009435 


Tabla PT5.2 Cálculos para estadísticos con las lecturas del coeficiente de 
expansión térmica. Las frecuencias y los límites se calculan para 
construir el histograma que se muestra en la figura PT5.2. 


Intervalo 
Límite Límite 
¡ Y (vi -yY Frecuencia inferior superior 
1 6.395 0.042025 1 6.36 6.40 
2 6.435 0.027225 1 6.40 6.44 
3 6.485 0.013225 
4 6.495 0.011025 
5 6.505 0.009025 4 6.48 6.52 
6 6.515 0.007225 
VA 6.555 0.002025 2 6.52 6.56 
8 6.555 0.002025 > 
9 6.565 0.001225 
0 6.575 0.000625 3 6.56 6.60 
1 6.595 0.000025 
2 6.605 0.000025 
3 6.615 0.000225 
4 6.625 0.000625 5 6.60 6.64 
5 6.625 0.000625 
6 6.635 0.001225 
7 6.655 0.003025 
8 6.655 0.003025 ; 3 6.64 6.68 
9 6.665 0.004225 
20 6.685 0.007225 
21 6.715 0.013225 3 6.68 6.72 
22 6.715 0.013225 
23 6.755 0.024025 1 6.72 6.76 
24 6.775 0.030625 1 6.76 6.80 


Y 158.4 0.217000 


y el coeficiente de variación [ecuación (PT3.5)]: 


0.097133 
v.= 


100% =1.47% 


PT5.2 Antecedentes matemáticos 


PT5.2.2 La distribución normal 


Otra característica útil en el presente análisis es la distribución de 
datos (es decir, la forma en que los datos se distribuyen alrededor 
de la media). Un histograma proporciona una representación visual 3 
simple de la distribución. Como se observa en la tabla PTS5.2, el 
histograma se construye al ordenar las mediciones en intervalos. 


Las unidades de medición se grafican en las abscisas; y la fre- 
cuencia de ocurrencia de cada intervalo, en las ordenadas. Así, 
cinco de las mediciones se encuentran entre 6.60 y 6.64. Como se 


Frecuencia 
105) 
T 
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advierte en la figura PT5.2, el histograma indica que la mayoría 1L 
de los datos se agrupa cerca del valor de la media de 6.6. 
Si se tiene un conjunto muy grande de datos, el histograma 0 


y s a 6.4 6.6 
se puede aproximar mediante una curva suave. La curva simétri- 


ca, en forma de campana que se sobrepone en la figura PT5.2, es 

una de estas formas características (la distribución normal). Da- Figura PT5.2 
das suficientes mediciones, en este caso particular el histograma 
se aproximará a la distribución normal. 

Los conceptos de media, desviación estándar, suma del cua- 
drado de los residuales y distribución normal tienen una gran im- 
portancia en la práctica de la ingeniería. Un ejemplo muy simple 
es su uso para cuantificar la confianza que se puede tener en una 
medición en particular. Si una cantidad está normalmente distri- 
buida, el intervalo limitado por y—s, y y + s, abarcará en forma aproximada el 68% de las mediciones 
totales. De manera similar, el intervalo limitado por y — 2s, y y + 2s, abarcará alrededor del 95%. 

Por ejemplo, para los datos de la tabla PT5.1 (y = 6.6 y s, = 0.097133), se afirma que aproxima- 
damente el 95% de las lecturas deberán estar entre 6.405734 y 6.794266. Si alguien nos dijera que 
tomó una lectura de 7.35, entonces sospecharíamos que la medición resultó errónea. En la siguiente 
sección se estudiarán dichas evaluaciones. 


PT5.2.3 Estimación de los intervalos de confianza 


Como resultará claro de lo expuesto en la sección anterior, uno de los principales objetivos de la 
estadística es estimar las propiedades de una población basándose en una muestra limitada que se 
toma de esa población. Es evidente que es imposible medir el coeficiente de expansión térmica de 
cada pieza producida de acero. En consecuencia, como se muestra en las tablas PT5.1 y PT5.2, es 
posible realizar un número de mediciones en forma aleatoria y, con base en la muestra, intentar 
caracterizar las propiedades de toda la población. 

Debido a que se “infieren” propiedades de la población desconocida a partir de una muestra 
limitada, el procedimiento se denomina inferencia estadística. Ya que los resultados a menudo se 
reportan como estimaciones de los parámetros de la población, el proceso también se conoce como 
estimación. 

Ya se mostró cómo estimar la tendencia central (media de la muestra, y) y la dispersión (des- 
viación estándar y varianza de la muestra) de una muestra limitada. Ahora, se describirá en forma 
breve cómo realizar aseveraciones probabilísticas respecto de la calidad de esas estimaciones. En 
particular, se analizará cómo definir un intervalo de confianza alrededor de un estimado de la media. 
Se ha escogido este tópico en particular debido a su relevancia directa para los modelos de regresión 
que se describirán en el capítulo 17. 

En el siguiente análisis observe que la nomenclatura y y s, se refieren a la media de la muestra 
y a su desviación estándar, respectivamente. La nomenclatura 4 y O se refieren a la media y la des- 
viación estándar de la población. Las primeras son algunas veces referidas como la media y desvia- 
ción estándar “estimadas”; mientras que las últimas se llaman la media y la desviación estándar 
“verdaderas”. 

Un estimador de intervalo proporciona el rango de valores dentro del que se espera que esté 
el parámetro, con una probabilidad dada. Tales intervalos se describen como unilateral y bilateral. 


6.8 


Histograma usado para ilustrar la distribución de datos. 
Conforme el número de datos aumenta, el histograma se 
aproximará a una curva suave, la curva en forma de cam- 
pana, llamada la distribución normal. 
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Distribución de las 
medias de y, y 


a) 
IL =07 p d U 
z 
b) | 
O 
Figura PT5.3 


Un intervalo de confianza bilateral. La escala de la abscisa en 
a) se escribe en las unidades originales de la variable aleato- 
ria y. b) Es una versión normalizada de las abscisas que tiene 
la media ubicada en el origen y se escala el eje de tal mane- 
ra que la desviación estándar corresponda a una unidad. 


Como su nombre lo indica, un intervalo unilateral expresa nues- 
tra confianza en que el parámetro estimado sea menor que o 
mayor que el valor real. En cambio, el intervalo bilateral tiene 
que ver con la proposición más general en que la estimación 
concuerda con la verdad, sin considerar el signo de la discrepan- 
cia. Como éste es más general, nos ocuparemos del intervalo 
bilateral. 
Un intervalo bilateral se describe con la relación 


PIL<u<Uj=1-a 


que se lee: “la probabilidad de que la media real de y, y, esté den- 
tro de los límites de La U'es 1 —a”. La cantidad a se conoce como 
el nivel de significancia. De esta forma, el problema de definir un 
intervalo de confianza se reduce a estimar L y U. Aunque no es 
absolutamente necesario, es costumbre visualizar el intervalo bi- 
lateral con la probabilidad a, distribuida de manera uniforme, con 
a/2 en cada cola de la distribución, como se muestra en la figura 
PT5.3. 

Si se conoce la varianza real de la distribución de y, 0? (lo 
cual no es frecuente), la teoría estadística establece que la media 
de la muestra y proviene de una distribución normal con media u 
y varianza 0”/n (cuadro PTS5.1). En el caso ilustrado en la figura 
PTS5.3, no se conoce realmente u. Por lo tanto, no se sabe dónde 


se ubica con exactitud la curva normal con respecto a y. Para evitar este dilema, se calcula una nue- 
va cantidad, el estimador normal estándar 


Cuadro PT5.1 Un poco de estadística 


La mayoría de los ingenieros toman varios cursos de estadística. 
Como usted tal vez aún no ha tomado alguno se mencionarán algunas 
nociones que harán que esta sección sea más coherente. 

Como se ha mencionado, el “juego” de la estadística inferencial 
supone que la variable aleatoria que usted muestrea, y, tiene media 
(u) y varianza (0?) verdaderas. Además, en este análisis se supondrá 
que tiene una distribución particular: la distribución normal. La va- 
rianza de esta distribución normal tiene un valor finito que especifica 
la “dispersión” de la distribución normal. Si la varianza es grande, la 
distribución es amplia. En cambio, si la varianza es pequeña, la dis- 
tribución es estrecha. Así, la varianza real cuantifica la incertidumbre 
intrínseca de la variable aleatoria. 

En el juego de la estadística, se toma un número limitado de 
mediciones de una cantidad, a la que se le llama muestra. De esta 
muestra, se calculan una media (y) y una varianza (5) estimadas. 
Cuantas más mediciones se tomen, mejor serán las estimaciones 
para que se aproximen a los valores verdaderos. Esto es, cuando 
n>eoy>ouys>o0?. 

Suponga que se toman n muestras y se calcula una media esti- 
mada y,. Después se toman otras n muestras y se calcula otra, y,. Se 
puede repetir este proceso hasta que se haya generado una muestra de 
medias: Y;, Y», Y3, -..> Y» donde m es grande. Entonces se construye 
un histograma de estas medias y se determina una “distribución de las 
medias”, así como una “media de las medias” y una “desviación están- 
dar de las medias”. Ahora surge la pregunta: ¿esta nueva distribución 
de medias y sus estadísticos se comportan en una forma predecible? 


Existe un teorema muy importante conocido como el teorema 
del límite central que responde en forma directa a esta pregunta y se 
enuncia como sigue 


Sea Y, Y», ..., Y, Una muestra aleatoria de tamaño n tomada 
de una distribución con media u y varianza 0”. Entonces, para n 
grandes, y es aproximadamente normal con la media u y la varianza 
0%n. Además, para n grande, la variable aleatoria (y — M0//n) 
es aproximadamente normal estándar. 


Así, el teorema establece el resultado interesante de que la dis- 
tribución de las medias siempre estará normalmente distribuida, ¡sin 
importar la distribución de las variables aleatorias de que se trate! 
Esto también da el resultado esperado, de que dada una muestra su- 
ficientemente grande, la media de las medias deberá converger hacia 
la verdadera media de la población . 

Además, el teorema indica que conforme crezca el tamaño de la 
muestra, la varianza de las medias se aproximará a cero. Esto tiene 
sentido, ya que si n es pequeña, las estimaciones individuales de la 
media serán pobres, y las varianzas de las medias, grandes. En tanto 
n aumente, la estimación de la media mejorará y, por lo tanto, dismi- 
nuirá su dispersión. El teorema del límite central claramente define, 
en forma exacta, cómo esta disminución está relacionada tanto con la 
varianza real como con el tamaño de la muestra; es decir, como 0?/n. 

Por último, el teorema establece el importante resultado que se ha 
dado en la ecuación (PT5.6). Como se muestra en esta sección, este 
teorema es la base para construir intervalos de confianza para la media. 
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YH 


(PT5.6) 
ol/n 


E 


que representa la distancia normalizada entre y y u. De acuerdo con la teoría estadística, esta cantidad 
deberá estar distribuida normalmente con media O y varianza 1. Además, la probabilidad de que z 
esté dentro de la región no sombreada de la figura PT5.3 será 1 — «z. Por lo tanto, se establece que 


y-H yJ-H 
<—Z q o ——=>2, 
ol /n PA ol/n is 


con una probabilidad de «. 

La cantidad z,,,, es una variable aleatoria normal estándar. Ésta es la distancia medida a lo largo 
del eje normalizado arriba y debajo de la media, que corresponde la probabilidad 1 —« (figura PT5.3b). 
Los valores de z,,, están tabulados en libros de estadística (por ejemplo, Milton y Arnold, 2002). 
También pueden calcularse usando funciones de paquetes de software como Excel, MATLAB y 
Mathcad. Como un ejemplo, para a: =0.05 (en otras palabras, definiendo un intervalo que comprenda 
95%), z,,,, eS aproximadamente igual a 1.96. Esto significa que un intervalo alrededor de la media con 
un ancho +1.96 veces la desviación estándar abarcará, en forma aproximada, el 95% de la distribución. 

Esos resultados se reordenan para obtener 


LSusU 
con una probabilidad de 1 — «, donde 


O O 
ESPE y U=+=zx, (PT5.7) 
a e a 


Ahora, aunque lo anterior ofrece una estimación de £ y U, está basado en el conocimiento de la 
verdadera varianza O. Y en nuestro caso, conocemos solamente la varianza estimada s,. Una alter- 
nativa inmediata sería una versión de la ecuación (PT5.6) basada en s,.: 


a (PTS.8) 
s,//n 


Aun cuando la muestra se tome de una distribución 
normal, esta fracción no estará normalmente distribuida, 
en particular cuando n sea pequeña. W. S. Gossett encontró 
que la variable aleatoria definida por la ecuación (PT5.8) 
sigue la llamada distribución £ de Student o, simplemente, 
distribución t. En este caso, 


s Ss, 
E=sy= jp atan U=y+ jp alan (PT5.9) 
donde f.y» ,- , es la variable aleatoria estándar de la distri- 
bución f para una probabilidad de /2. Como en el caso de 
Zan» los valores están tabulados en libros de estadística, y 
también se calculan mediante paquetes de software. Por 
ejemplo, si a =0.05 y n=20, £,,, , 1 = 2.086. 

La distribución £ puede entenderse como una modifica- 
ción de la distribución normal que toma en cuenta el hecho 
de que se tiene una estimación imperfecta de la desviación 
estándar. Cuando n es pequeña, tiende a ser más plana que — p; gura PT5.4 


la normal (figura PT5.4). Entonces, para pocas mediciones, — Comparación de la distribución normal con la distribución t para 


se obtienen intervalos de confianza más amplios y, porlo  p=3 y n = 6. Observe cómo la distribución t en general es más 
tanto, más conservadores. Conforme n se vuelve más gran- plana. 


de, la distribución t converge a la normal. 
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EJEMPLO PT5.2 Intervalo de confianza alrededor de la media 
Planteamiento del problema Determine la media y el correspondiente intervalo de confianza 
del 95% para los datos de la tabla PT5.1. Realice 3 estimaciones basándose en a) las primeras 8 


mediciones, b) las primeras 16 mediciones y c) las 24 mediciones. 


Solución a) La media y la desviación estándar con los primeros 8 valores es 


= 7 
52.72 s, > HE (52.72)/8 = 0.089921 


8-1 
El estadístico £ apropiado se calcula como: 
toos. 51 = lo0257 = 2.364623 
que se utiliza para calcular el intervalo 


L=6.59- An 2.364623 = 6.5148 
4/8 


U=6.59+ Re 7 = 6.6652 
3 


6.5148 < y < 6.6652 


Así, considerando las primeras ocho mediciones, concluimos que existe un 95% de probabilidad de 
que la media real esté en el intervalo de 6.5148 a 6.6652. 

Los otros dos casos, b) con 16 valores y c) con 24 valores, se calculan en forma similar y los 
resultados se tabulan junto con los del inciso a) como sigue: 


n y Sy Cian-1 L U 

8 6.5900 0.089921 2.364623 6.5148 6.6652 
16 6.5794 0.095845 2.131451 6.5283 6.6304 
24 6.6000 0.097133 2.068655 6.5590 6.6410 


Estos resultados, que también se resumen en la figura PT5.5, indican el resultado esperado de que 
el intervalo de confianza se vuelve más pequeño conforme n aumenta. Así, cuantas más mediciones 
se tomen, nuestra estimación del valor verdadero será más refinado. 


| 


Figura PT5.5 a a MH n=24 


Estimaciones de la media e in- 
| | | 


tervalos de confianza del 95% T 1 | ] 
para diferentes tamaños de la 6.50 6.55 6.60 6.65 6.70 


muestra. Coeficiente de expansión térmica [X 10% in/(in + F)] 


PT5.3 Orientación 


Lo anterior es sólo un simple ejemplo de cómo se emplea la estadística para tomar decisiones 
respecto de datos inciertos. Esos conceptos también serán de relevancia en nuestro análisis de los 
modelos de regresión. Usted puede consultar cualquier libro básico de estadística (por ejemplo, 
Milton y Arnold, 2002) para obtener más información sobre este tema. 


PT5.3 ORIENTACIÓN 


Antes de proceder con los métodos numéricos para el ajuste de curvas, la siguiente orientación 
podría ser de utilidad. Este apartado se presenta como una visión general del material que se estu- 
dia en la parte cinco. Además, se formulan algunos objetivos para ayudar a enfocar su atención al 
analizar el tema. 


PT5.3.1 Alcance y presentación preliminar 


La figura PTS.6 proporciona una visión general del material que se estudiará en la parte cinco. El 
capítulo 17 se dedica a la regresión por mínimos cuadrados. Se aprenderá primero cómo ajustar 
la “mejor” línea recta a través de un conjunto de datos inciertos. Esta técnica se conoce como 
regresión lineal. Además de analizar cómo calcular la pendiente y la intersección, con el eje y, de 
esta línea recta, se presentarán también métodos visuales y cuantitativos para evaluar la validez 
de los resultados. 

Además de ajustar a una línea recta, se mostrará también una técnica general para ajustar a un 
“mejor” polinomio. Así, usted aprenderá a obtener un polinomio parabólico, cúbico o de un grado 
superior, que se ajuste en forma óptima a datos inciertos. La regresión lineal es un subconjunto de 
este procedimiento más general, llamado regresión polinomial. 

El siguiente tema que se analiza en el capítulo 17 es la regresión lineal múltiple. Está diseñada 
para el caso donde la variable dependiente y es una función lineal de dos o más variables indepen- 
dientes X;, X»,..., Xy, Este procedimiento tiene especial utilidad para evaluar datos experimentales 
donde la variable de interés es dependiente de varios factores. 

Después de la regresión múltiple, ilustramos cómo tanto la regresión polinomial como la múl- 
tiple son subconjuntos de un modelo lineal general de mínimos cuadrados. Entre otras cuestiones, 
esto nos permitirá introducir una representación matricial concisa de la regresión y analizar sus 
propiedades estadísticas generales. 

Por último, las últimas secciones del capítulo 17 se dedican a la regresión no lineal. Este pro- 
cedimiento está diseñado para calcular un ajuste por mínimos cuadrados de una ecuación no lineal 
a datos. 

En el capítulo 18 se describe la técnica alternativa para el ajuste de curvas llamada interpolación. 
Como se analizó antes, la interpolación se utiliza para estimar valores intermedios entre datos pre- 
cisos. En el capítulo 18 se obtienen polinomios con este propósito. Se introduce el concepto básico 
de interpolación polinomial usando líneas rectas y parábolas para unir los puntos. Después, se de- 
sarrolla un procedimiento generalizado para ajustar un polinomio de grado n. Se presentan dos 
métodos para expresar tales polinomios en forma de ecuación. El primero, llamado interpolación 
polinomial de Newton, es preferible cuando se desconoce el grado apropiado del polinomio. El se- 
gundo, llamado interpolación polinomial de Lagrange, tiene ventajas cuando de antemano se cono- 
ce el grado apropiado. 

La siguiente sección del capítulo 18 presenta una técnica alternativa para ajustar datos precisos. 
Ésta, llamada interpolación mediante trazadores o splines, ajusta polinomios a datos, pero en forma 
de trozos. Como tal, es particularmente adecuada para ajustar datos que en general son suaves pero 
que muestren abruptos cambios locales. Finalmente, se da una breve introducción a la interpolación 
multidimensional. 

El capítulo 19 tiene que ver con el método de la transformada de Fourier para el ajuste de curvas, 
donde funciones periódicas se ajustan a datos. Nuestro énfasis en esta sección residirá en la trans- 
formada rápida de Fourier. Al final se incluye también una revisión de algunos paquetes de software 
que se utilizan para el ajuste de curvas; entre ellos se encuentran Excel, MATLAB y Mathcad. 
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El capítulo 20 se dedica a aplicaciones en la ingeniería que ilustran la utilidad de los métodos 
numéricos en el contexto de los problemas de ingeniería. Los ejemplos se toman de las cuatro áreas 
principales de la ingeniería: química, civil, eléctrica y mecánica. Además, algunas de las aplicacio- 
nes ilustran cómo se emplean los paquetes de software para resolver problemas de ingeniería. 
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ca de la organización del material en la parte cinco: Ajuste de curvas. 


Por último, se incluye un epílogo al final de la parte cinco. Contiene un resumen de las fórmu- 
las y los conceptos importantes relacionados con el ajuste de curvas, así como un análisis de las 
ventajas y desventajas de las técnicas, y sugerencias para futuros estudios. 


PT5.3.2 Metas y objetivos 


Objetivos de estudio Después de estudiar la parte cinco, usted habrá mejorado su capacidad 
para ajustar curvas a los datos. En general, usted dominará las técnicas, habrá aprendido a valorar 


PT5.3 Orientación 


la confiabilidad de los resultados y será capaz de seleccionar el método (o métodos) para cualquier 
problema específico. Además de estas metas generales, los conceptos particulares de la tabla PT5.3 
deberán asimilarse y dominarse. 


Objetivos computacionales Se le han proporcionado algoritmos de cómputo simples para 
implementar las técnicas analizadas en la parte cinco. También usted puede tener acceso a los pa- 
quetes de software. Todo esto tiene utilidad como herramientas de aprendizaje. 

Se proporcionan algoritmos en pseudocódigo para la mayoría de los métodos en la parte cinco. 
Esta información le permitirá expandir sus bibliotecas de software para incluir técnicas más allá de 
la regresión polinomial. Por ejemplo, usted puede encontrar útil, desde un punto de vista profesional, 
tener software para la regresión lineal múltiple, la interpolación polinomial de Newton, la interpo- 
lación con trazadores cúbicos y la transformada rápida de Fourier. 

Además, una de las metas más importantes deberá ser dominar varios de los paquetes de software 
de utilidad general que están disponibles. En particular, usted debería acostumbrarse a usar esas 
herramientas para implementar métodos numéricos en la solución de problemas en ingeniería. 


Tabla PT5.3 Objetivos específicos de estudio de la parte cinco. 


1. Comprender la diferencia fundamental entre regresión e interpolación, y darse cuenta de que confundirlos 
puede llevar a serios problemas. 

2. Entender la deducción de la regresión lineal por mínimos cuadrados y ser capaz de evaluar la confiabilidad del 
ajuste mediante evaluaciones gráficas y cuantitativas. 

3. Saber cómo linearizar datos mediante transformación. 

4. Entender situaciones donde son apropiadas las regresiones polinomiales, múltiples y no lineales. 

5. Ser capaz de reconocer modelos lineales generales, entender la formulación matricial general para mínimos 
cuadrados lineales, y saber cómo calcular intervalos de confianza para parámetros. 

6. Entender que hay uno y sólo un polinomio de grado n o menor que pasa exactamente a través de n + 1 puntos. 

7. Saber cómo obtener el polinomio de interpolación de Newton de primer grado. 

8. Reconocer la analogía entre el polinomio de Newton y la expansión de la serie de Taylor, y cómo se relaciona el 

error de truncamiento. 

9. Comprender que las ecuaciones de Newton y Lagrange son simplemente formulaciones diferentes de la misma 

interpolación polinomial, y entender sus respectivas ventajas y desventajas. 

10. Percatarse de que, por lo general, se obtienen resultados más exactos si los datos usados para interpolación 

están más o menos centrados y cercanos al punto desconocido. 

1. Darse cuenta que los datos no tienen que estar igualmente espaciados ni en un orden particular para los poli- 

nomios de Newton o de Lagrange. 

2. Saber por qué son útiles las fórmulas de interpolación con igual espaciamiento. 

3. Reconocer las desventajas y los riesgos asociados con la extrapolación. 

4. Entender por qué los trazadores (splines) tienen utilidad para datos con áreas locales de cambio abrupto. 

5. Entender cómo se puede aplicar en dos dimensiones la interpolación de polinomios. 

6. Reconocer cómo se usa la serie de Fourier para ajustar datos a funciones periódicas. 

7. Entender la diferencia entre dominios de la frecuencia y del tiempo. 
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Regresión por mínimos cuadrados 


Cuando los datos tienen errores sustanciales, la interpolación polinomial es inapropiada y puede dar 
resultados poco satisfactorios cuando se utiliza para predecir valores intermedios. Con frecuencia 
los datos experimentales son de este tipo. Por ejemplo, en la figura 17.la se muestran siete datos 
obtenidos experimentalmente que presentan una variabilidad significativa. Una inspección visual 
de esos datos sugiere una posible relación entre y y x. Es decir, la tendencia general indica que va- 


yA 


o 
al 
Y 


b) 


=Y 


Figura 17.1 

a) Datos que muestran un error signi- 
ficativo. b) Ajuste polinomial oscilando 
más allá del rango de los datos. c) 
Resultados más satisfactorios median- 
te el ajuste por mínimos cuadrados. 


lores altos de y están asociados con valores altos de x. Ahora, si un polinomio de in- 
terpolación de sexto grado se ajusta a estos datos (figura 17.1b), pasará exactamente 
a través de todos los puntos. Sin embargo, a causa de la variabilidad en los datos, la 
curva oscila mucho en el intervalo entre los puntos. En particular, los valores inter- 
polados para x= 1.5 y x= 6.5 parecen estar bastante más allá del rango sugerido por 
los datos. 

Una estrategia más apropiada en tales casos consiste en obtener una función de 
aproximación que se ajuste a la forma o a la tendencia general de los datos, sin coin- 
cidir necesariamente en todos los puntos. La figura 17.1c ilustra cómo se utiliza una 
línea recta para caracterizar de manera general la tendencia de los datos sin pasar a 
través de algún punto específico. 

Una manera para determinar la línea de la figura 17.1c es inspeccionar en forma 
visual los datos graficados y después trazar una “mejor” línea a través de los puntos. 
Aunque tales procedimientos “a ojo” apelan al sentido común y son válidos para 
cálculos “superficiales”, resultan deficientes por ser arbitrarios. Es decir, a menos que 
los puntos definan una línea recta perfecta (en cuyo caso la interpolación resultaría 
apropiada), diferentes analistas dibujarían líneas distintas. 

Para dejar a un lado dicha subjetividad se debe encontrar algún criterio para es- 
tablecer una base para el ajuste. Una forma de hacerlo es obtener una curva que mi- 
nimice la discrepancia entre los puntos y la curva. Una técnica para lograr tal 
objetivo, llamada regresión por mínimos cuadrados, se analizará en este capítulo. 


17.1 REGRESIÓN LINEAL 


El ejemplo más simple de una aproximación por mínimos cuadrados es ajustar una 
línea recta a un conjunto de observaciones definidas por puntos: (x,, y,), Qt», y»),..., 
(%., y,). La expresión matemática para la línea recta es 


y=ay+ax+e (17.1) 


donde a, y a, son coeficientes que representan la intersección con el eje y y la pen- 
diente, respectivamente, e es el error, o diferencia, entre el modelo y las observaciones, 
el cual se representa al reordenar la ecuación (17.1) como 


e=y- ay - ax 
Así, el error o residuo es la discrepancia entre el valor verdadero de y y el valor 
aproximado, a, + a,x, que predijo la ecuación lineal. 

17.1.1 Criterio para un “mejor” ajuste 


Una estrategia para ajustar una “mejor” línea a través de los datos será minimizar la 
suma de los errores residuales de todos los datos disponibles, como sigue: 


17.1 Regresión lineal 


(Q,- 4, -4,x,) (17.2) ¿A 
i=l i=l e 


S 
Il 


donde n = número total de puntos. Sin embargo, éste es un criterio inadecuado, como 
lo muestra la figura 17.2a, la cual presenta el ajuste de una línea recta de dos puntos. 
Obviamente, el mejor ajuste es la línea que une los puntos. Sin embargo, cualquier 


e 


e 
Punto medio Ys 
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línea recta que pase a través del punto medio que une la línea (excepto una línea 
perfectamente vertical) da como resultado un valor mínimo de la ecuación (17.2) 
igual a cero, debido a que los errores se cancelan. 

Por lo tanto, otro criterio lógico podría ser minimizar la suma de los valores 
absolutos de las diferencias, 


n 


y 


il 


e; 


n 
= y a » 
= ly, Ay =41X; o 
y 
¡=1 


a) 


> 
OOO 
-= e” 0 


dl 


SÍ 
> 
»? 


La figura 17.2b muestra por qué este criterio también es inadecuado. Para los cuatro 
puntos dados, cualquier línea recta que esté dentro de las líneas punteadas minimiza- 
rá el valor absoluto de la suma. Así, este criterio tampoco dará un único mejor ajuste. 

Una tercera estrategia para ajustar una mejor línea es el criterio minimax. En 
esta técnica, la línea se elige de manera que minimice la máxima distancia a que un 
punto se encuentra de la línea. Como se ilustra en la figura 17.2c, tal estrategia es 
inadecuada para la regresión, ya que da excesiva influencia a puntos fuera del con- 


b) 


junto; es decir, a un solo punto con un gran error. Deberá observarse que el principio O Punto fuera 
minimax es, en algunas ocasiones, adecuado para ajustar una función simple a una del conjunto | 
función complicada (Carnahan, Luther y Wilkes, 1969). o) úl 
La estrategia que supera las deficiencias de los procedimientos mencionados 
consiste en minimizar la suma de los cuadrados de los residuos entre la y medida y . 
la y calculada con el modelo lineal Figura E e " 
Ejemplo de algunos criterios para ”el 
za Le E mejor ajuste” que son inadecuados 
=P ..=)P 1 E Y=)9 0-4 -axy 173 ió inimi 
12% = Dimedida — Y ismodelo). = y; — 4, —01X, (17.3) — para la regresión: a) minimizar la suma 
i=l i=l il 


de los residuos, b) minimizar la suma de 


Este criterio tiene varias ventajas, entre ellas el hecho de que se obtiene una línea 
única para cierto conjunto de datos. Antes de analizar tales propiedades, presentaremos 
una técnica para determinar los valores de a, y a, que minimizan la ecuación (17.3). 


17.1.2 Ajuste de una línea recta por mínimos cuadrados 


Para determinar los valores de a, y a,, la ecuación (17.3) se deriva con respecto a cada uno de los 
coeficientes: 


as, 

de =-2 > (y, — 4, — 4,X,) 
OS. 

da =-2 > [(y, — 4, — 4,x,)x,1 


Observe que hemos simplificado los símbolos de la sumatoria; a menos que se indique otra cosa, 
todas las sumatorias van desde ¡= 1 hasta n. Al igualar estas derivadas a cero, se dará como resul- 
tado un S, mínimo. Si se hace esto, las ecuaciones se expresan como 


o= yy a, - y, aX; 
o= Y ya, - Y ayx, — Y ax; 


Ahora, si observamos que *a, = na, expresamos las ecuaciones como un conjunto de dos ecuacio- 
nes lineales simultáneas, con dos incógnitas (a, y a): 


los valores absolutos de los residuos y 
c) minimizar el error máximo de cual- 
quier punto individual. 


360 


Capítulo 17 Regresión por mínimos cuadrados 


na, +[Y x)a, = Sy, 
(Y) + (Y )a= Y 1, 


Estas se llaman ecuaciones normales, y se resuelven en forma simultánea 


0 = HANS AA Y, 
ó ANA A 


Este resultado se utiliza conjuntamente con la ecuación (17.4) para obtener 


dy= y -a¡x 


donde y y x son las medias de y y x, respectivamente. 


EJEMPLO 17.1 Regresión lineal 


(17.4) 


(17.5) 


(17.6) 


(17.7) 


Planteamiento del problema Ajuste a una línea recta los valores x y y en las dos primeras 


columnas de la tabla 17.1. 


Tabla 17.1 Cálculos para el análisis de error en el 


ajuste lineal. 
Xi Yi (.-Yy) (y, - ap - ax)? 
1 0.5 8.5765 0.1687 
2 25 0.8622 0.5625 
3 2.0 2.0408 0,3473 
4 4.0 0.3265 0.3265 
5 35 0.0051 0.5896 
6 6.0 6.6122 0.7972 
7 55 4.2908 0.1993 
> 24.0 22.7143 2.9911 


Solución Se calculan las siguientes cantidades: 


n=7 Y 121195 Y xi =140 


SY x,=28 pie 
7 
Y y,=24 y =P =3:428511 


Mediante las ecuaciones (17.6) y (17.7) 


- 7(119.5)-28(24) 
7140)-(Q8y 


= 0.8392857 


1 


ay = 3.428571 — 0.8392857(4) = 0.07142857 
Por lo tanto, el ajuste por mínimos cuadrados es 


y = 0.07142857 + 0.8392857x 


La línea, junto con los datos, se muestran en la figura 17.1c. 


17.1 Regresión lineal 


17.1.3 Cuantificación del error en la regresión 
lineal 


Cualquier otra línea diferente a la calculada en el ejemplo 17.1 Medición 
dará como resultado una suma mayor de los cuadrados de los re- a 
siduos. Así, la línea es única y, en términos de nuestro criterio 
elegido, es la “mejor” línea a través de los puntos. Varias propie- 
dades de este ajuste se observan al examinar más de cerca la 
forma en que se calcularon los residuos. Recuerde que la suma de 
los cuadrados se define como [ecuación (17.3)] 


S, =2, e, =2 (y, -a,— ax, (17.8) 


Observe la similitud entre las ecuaciones (PT5.3) y (17.8). En 
el primer caso, el cuadrado del residuo representa el cuadrado de la 
diferencia entre el dato y una estimación de la medida de tendencia Figura 17.3 


Ay + 01X; 


central: la media. En la ecuación (17.8), el cuadrado del residuo El residuo en la regresión lineal representa la distancia 
representa el cuadrado de la distancia vertical entre el dato y otra vertical entre un dato y la línea recta. 


medida de tendencia central: la línea recta (figura 17.3). 

La analogía se puede extender aún más en casos donde 1) la 
dispersión de los puntos alrededor de la línea es de magnitud simi- 
lar en todo el rango de los datos, y 2) la distribución de estos puntos cerca de la línea es normal. Es 
posible demostrar que si estos criterios se cumplen, la regresión por mínimos cuadrados proporcio- 
nará la mejor (es decir, la más adecuada) estimación de a, y a, (Draper y Smith, 1981). Esto se co- 
noce en estadística como el principio de máxima verosimilitud. Además, si estos criterios se 
satisfacen, una “desviación estándar” para la línea de regresión se determina como sigue [compare 
con la ecuación (PT3.2)] 


Si = (17.9) 


donde a s,,, se le llama error estándar de la estimación. El subíndice “y/x” designa que el error es 
para un valor predicho de y correspondiente a un valor particular de x. También, observe que ahora 
dividimos entre n — 2 debido a que se usaron dos datos estimados (a, y a,), para calcular S,; así, se 
han perdido dos grados de libertad. Como lo hicimos en nuestro análisis para la desviación estándar 
en PT5.2.1, otra justificación para dividir entre n — 2 es que no existe algo como “datos dispersos” 
alrededor de una línea recta que une dos puntos. De esta manera, en el caso donde n =2, la ecuación 
(17.9) da un resultado sin sentido, infinito. 

Así como en el caso de la desviación estándar, el error estándar de la estimación cuantifica la 
dispersión de los datos. Aunque, s,,, cuantifica la dispersión alrededor de la línea de regresión, como 
se muestra en la figura 17.4b, a diferencia de la desviación estándar original s, que cuantifica la 
dispersión alrededor de la media (figura 17.4a). 


Figura 17.4 


a) b) lineal. 


Datos de regresión que muestran a) la 
dispersión de los datos alrededor de 

la media de la variable dependiente 

y b) la dispersión de los datos alrededor 
de la línea de mejor ajuste. La 
reducción en la dispersión al ir de 

a) a b), como lo indican las curvas en 
forma de campana a la derecha, repre- 
senta la mejora debida a la regresión 
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YA 
O 
0 
z 
a) 
PA 
Y 
b) 
Figura 17.5 


Ejemplos de regresión lineal con errores 
residuales a) pequeños y b) grandes. 


Regresión por mínimos cuadrados 


Los conceptos anteriores se utilizan para cuantificar la “bondad” de nuestro 
ajuste. Esto es en particular útil para comparar diferentes regresiones (figura 17.5). 
Para hacerlo, regresamos a los datos originales y determinamos la suma total de 
los cuadrados alrededor de la media para la variable dependiente (en nuestro caso, 
y). Como en el caso de la ecuación (PTS5.3), esta cantidad se designa por S,. Ésta 
es la magnitud del error residual asociado con la variable dependiente antes de la 
regresión. Después de realizar la regresión, calculamos $,, es decir, la suma de los 
cuadrados de los residuos alrededor de la línea de regresión. Esto caracteriza el 
error residual que queda después de la regresión. Es por lo que, algunas veces, se 
le llama la suma inexplicable de los cuadrados. La diferencia entre estas dos can- 
tidades, S,— S,, cuantifica la mejora o reducción del error por describir los datos 
en términos de una línea recta en vez de un valor promedio. Como la magnitud de 
esta cantidad depende de la escala, la diferencia se normaliza a S, para obtener 


r?= z (17.10) 


donde r? se conoce como el coeficiente de determinación y r es el coeficiente de co- 
rrelación (= Vr? ). En un ajuste perfecto, S,=0 y r=+?= 1, significa que la línea 
explica el 100% de la variabilidad de los datos. Si r =r?=0, S, = S, el ajuste no 
representa alguna mejora. Una representación alternativa para r que es más conve- 
niente para implementarse en una computadora es 


ma O OZ) (17.11) 


A 


EJEMPLO 17.2 Estimación de errores en el ajuste lineal por mínimos cuadrados 


Planteamiento del problema Calcule la desviación estándar total, el error estándar del esti- 
mado y el coeficiente de correlación para los datos del ejemplo 17.1. 


Solución Las sumatorias se realizan y se presentan en la tabla 17.1. La desviación estándar es 
[ecuación (PT5.2)] 


e 221143 _, 9457 
: Al 


y el error estándar del estimado es [ecuación (17.9)] 


2.9911 
Su. =4| — =0.7735 


Como s,,, 


< s,, el modelo de regresión lineal es adecuado. La mejora se puede cuantificar mediante 


[ecuación (17.10)] 


¡is 22.7143-2.9911 


= 0.868 


22.7143 


r= 0.868 = 0.932 


Los resultados indican que el modelo lineal explicó el 86.8% de la incertidumbre original. 


17.1 Regresión lineal 


Antes de implementar el programa computacional para la regresión lineal, debemos tomar en 
cuenta algunas consideraciones. Aunque el coeficiente de correlación ofrece una manera fácil de 
medir la bondad del ajuste, se deberá tener cuidado de no darle más significado del que ya tiene. El 
solo hecho de que r sea “cercana” a 1 no necesariamente significa que el ajuste sea “bueno”. Por 
ejemplo, es posible obtener un valor relativamente alto de r cuando la relación entre y y x no es lineal. 
Draper y Smith (1981) proporcionan guías y material adicional respecto a la evaluación de resultados 
en la regresión lineal. Además, como mínimo, usted deberá inspeccionar siempre una gráfica de los 
datos junto con su curva de regresión. Como se describe en la siguiente sección, los paquetes de 
software tienen estas capacidades. 


17.1.4 Programa computacional para la regresión lineal 


Es relativamente fácil desarrollar un pseudocódigo para la regresión lineal (figura 17.6). Como se 
mencionó antes, la opción de graficar resulta benéfico para el uso efectivo y la interpretación de la 
regresión. Tales capacidades se incluyen en paquetes de software populares como Excel y MATLAB. 
Si su lenguaje de computación tiene capacidad para graficar, recomendamos que expanda su progra- 
ma para incluir una gráfica de y contra x, que muestre tanto los datos como la línea de regresión. La 
inclusión de la capacidad aumentará mucho la utilidad del programa en los contextos de solución de 
problemas. 


EJEMPLO 17.3 Regresión lineal usando la computadora 
Planteamiento del problema Se utiliza el software basado en la figura 17.6 para resolver un 
problema de prueba de hipótesis relacionado con la caída del paracaidista que se analizó en el capí- 


tulo 1. Un modelo teórico matemático para la velocidad del paracaidista se dio como sigue [ecuación 
(1.10)]: 


v(t) a cido E gema) 
Cc 


SUB Regressíx, y, n, al, a0, Syx, r2) 


[a] 


sumx = 0: sumxy = 0: st = 
sumy = 0: sumx2 = 0: sr = 
DOFOR ¡= 1, n 
SUMX = SUMX + X; 
Ssumy = SUMY + Y; 
SUMXY = SUMXY + X¡*y; 
Ssumx2 = Sumx2 + X;¡*X; 
END DO 
xm= sumx/n 
ym = sumy/n 
al (n*sumxy — sumx*sumy)/ (n*sumx2 — sumx*sumx) 
a0 = ym — al*xm 
DOFOR ¡1 = 1, n 
st= st + (y, — ym)? 
sr=sSr+ (y, = al*x, = a0) 
END DO 
syx = (sriín= 2))%* 
r2= (st — sr)/st 


S 


l 


END Regress 


Figura 17.6 
Algoritmo para la regresión lineal. 
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donde v = velocidad (m/s), g = constante gravitacional (9.8 m/s?), m = masa del paracaidista igual a 
68.1 kg y c= coeficiente de arrastre de 12.5 kg/s. El modelo predice la velocidad del paracaidista en 
función del tiempo, como se describe en el ejemplo 1.1. 

Un modelo empírico alternativo para la velocidad del paracaidista está dado por 


gm Í 
1) = y —— E17.3.1 
0 Cc (315+) ' 


Suponga que usted quiere probar y comparar la veracidad de esos dos modelos matemáticos. 
Esto se podría hacer al medir la velocidad real del paracaidista con valores conocidos de tiempo y 
al comparar estos resultados con las velocidades predichas de acuerdo con cada modelo. 

Se implementó un programa para la recolección de datos experimentales, y los resultados se 
enlistan en la columna a) de la tabla 17.2. Las velocidades calculadas con cada modelo se enlistan 
en las columnas b) y c). 


Solución La veracidad de los modelos se prueba al graficar la velocidad calculada por el modelo 
contra la velocidad medida. Se puede usar la regresión lineal para calcular la pendiente y la inter- 
sección con el eje y de la gráfica. Esta línea tendrá una pendiente de 1, una intersección de O y r?= 1 
si el modelo concuerda perfectamente con los datos. Una desviación significativa de estos valores 
sirve como una indicación de lo inadecuado del modelo. 

Las figuras 17.7a y b muestran gráficas de la línea y los datos para las regresiones de las colum- 
nas b) y c), respectivamente, contra la columna a). Para el primer modelo [ecuación (1.10) como se 
ilustra en la figura 17.7a] 


Tabla 17.2 Velocidades medidas y calculadas para la caída del paracaidista. 


v calculada v calculada 
v medida, con el modelo, con el modelo, 
m/s m/s [ec. (1.10)] m/s [ec. (E17.3.1)] 
Tiempo, s a) b) c) 

1 10.00 8.953 11.240 

2 16.30 16.405 18.570 

3 23.00 22.607 23.729 

4 27.50 27.769 27.556 

5 31.00 32.065 30.509 

6 35.60 35.641 32.855 

ES 39.00 38.617 34.766 

8 41.50 41.095 36.351 

9 42.90 43.156 37.687 
10 45.00 44.872 38.829 
11 46.00 46.301 39.816 
12 45.50 47.490 40.678 
13 46.00 48.479 41.437 
14 49.00 49.303 42.110 
15 


50.00 49.988 42.712 


Y 0.859 + 1.032u 


modelo — medida 


y para el segundo modelo [ecuación (E17.3.1) como se ilustra en la figura 17.7b], 


Unodeio =5.776 + 0.752v 


medida 


Esas gráficas indican que la regresión lineal entre los datos y cada uno de los modelos es altamente 
significativa. Ambos modelos ajustan los datos con un coeficiente de correlación mayor a 0.99. 

No obstante, el modelo descrito por la ecuación (1.10) se ajusta mejor a nuestro criterio de prue- 
ba de hipótesis que el descrito por la ecuación (E17.3.1), ya que la pendiente y la intersección con el 


17.1 Regresión lineal 


eje y son más cercanos a 1 y 0. Así, aunque cada gráfica queda bien descrita por una línea recta, la 
ecuación (1.10) parece ser un mejor modelo que la (E17.3.1). 

La prueba y la selección del modelo son actividades comunes y muy importantes en todas las 
ramas de la ingeniería. El material que se presentó antes en este capítulo, junto con su software, le 
ayudarán a resolver muchos problemas prácticos de este tipo. 


El análisis en el ejemplo 17.3 tiene un defecto: el ejemplo no fue ambiguo, ya que el modelo 
empírico [ecuación (E17.3.1)] fue claramente inferior al de la ecuación (1.10). La pendiente y la in- 
tersección en el modelo empírico fueron mucho más cercanos a los resultados deseados 1 y 0, por 
lo que resultó obvio cuál era el mejor modelo. 

Sin embargo, suponga que la pendiente fuera de 0.85 y que la intersección con el eje y fuera de 
2. Obviamente esto llevaría a la conclusión de que la pendiente y la intersección fueran 1 y O respec- 
tivamente. Por lo anterior, es claro que, más que apoyarse en un juicio subjetivo, es preferible basar 
tal conclusión sobre un criterio cuantitativo. 

Esto se logra al calcular intervalos de confianza para los parámetros del modelo, de la misma 
forma que desarrollamos intervalos de confianza para la media en la sección PT5.2,3. Regresaremos 
a este punto al final del capítulo. 


Figura 17.7 

a) Resultados con regresión lineal para comparar las predicciones calculadas con el modelo teórico 
[ecuación (1.10)] contra valores medidos. b) Resultados con regresión lineal para comparar predicciones 
calculadas con el modelo empírico [ecuación (E17.3.1] contra valores medidos. 


17.1.5 Linealización de relaciones no lineales 


La regresión lineal ofrece una poderosa técnica para ajustar una mejor línea a los datos. Sin embar- 
go, se considera el hecho de que la relación entre las variables dependiente e independiente es lineal. 
Éste no es siempre el caso, y el primer paso en cualquier análisis de regresión deberá ser graficar e 
inspeccionar los datos en forma visual, para asegurarnos que sea posible usar un modelo lineal. Por 
ejemplo, la figura 17.8 muestra algunos datos que obviamente son curvilíneos. En algunos casos, las 
técnicas como la regresión polinomial, que se describen en la sección 17.2, son apropiadas. En otros, 
se pueden utilizar transformaciones para expresar los datos en una forma que sea compatible con la 
regresión lineal. 
Un ejemplo es el modelo exponencial 


y=0, e" (17.12) 


donde a., y f, son constantes. Este modelo se emplea en muchos campos de la ingeniería para carac- 
terizar cantidades que aumentan ($, positivo) o disminuyen ($, negativo), a una velocidad que es 


365 


366 Capítulo 17 Regresión por mínimos cuadrados 
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a) b) 
Figura 17.8 


a) Datos inadecuados para la regresión lineal por mínimos cuadrados. b) Indicación de que es preferible 
una parábola. 


directamente proporcional a sus propias magnitudes. Por ejemplo, el crecimiento poblacional o el 
decaimiento radiactivo tienen este comportamiento. Como se ilustra en la figura 17.9a, la ecuación 
representa una relación no lineal (para $, + 0) entre y y x. 


a) b) Cc) 


Linealización 


Linealización 


Linealización 


ny, log y 4 Y, 


Pendiente = $6, h 
- Pendiente = fBy/: 
Pendiente = $; endiente = fBy/a, 


Intersección = 1/a, 


Intersección = In a; 


- - 


log x 1/x 


=Y 


Intersección = log a, 


d) e) 1) 


Figura 17.9 
a) La ecuación exponencial, b) la ecuación de potencias y c) la ecuación de razón del crecimiento. Los 
incisos ad), e) y f) son versiones linealizadas de estas ecuaciones que resultan de transformaciones simples. 


17.1 Regresión lineal 


Otro ejemplo de modelo no lineal es la ecuación de potencias 
year" (17.13) 


donde a, y $, son coeficientes constantes. Este modelo tiene muchas aplicaciones en todos los cam- 
pos de la ingeniería. Como se ilustra en la figura 17.9b, la ecuación (para $, 4 0 o 1) es no lineal. 
Un tercer ejemplo de un modelo no lineal es la ecuación de razón del crecimiento [recuerde la 
ecuación (E17.3.1)] 
y=0,— (17.14) 
B+x 
donde a, y f, son coeficientes constantes. Este modelo particularmente es adecuado para caracteri- 
zar la razón de crecimiento poblacional bajo condiciones limitantes, también representa una relación 
no lineal entre y y x (figura 17.9c) que se iguala o “satura”, conforme x aumenta. 
Hay técnicas de regresión no lineal disponibles para ajustar estas ecuaciones de manera directa 
a datos experimentales. (Observe que analizaremos la regresión no lineal en la sección 17.5.) Sin 
embargo, una alternativa simple consiste en usar manipulaciones matemáticas para transformar las 
ecuaciones en una forma lineal. Después, se utiliza la regresión lineal simple para ajustar las ecua- 
ciones a los datos. 
Por ejemplo, la ecuación (17.12) se linealiza al aplicarle el logaritmo natural obteniendo 


Iny=Ina,+f,xIne 
Pero como In e =1, 
ln y =1n q, + Bix (17.15) 


Así, una gráfica de ln y contra x dará una línea recta con una pendiente $, y una intersección con el 
eje de las ordenadas igual a In a, (figura 17.9d). 
La ecuación (17.13) es linealizada al aplicarle el logaritmo de base 10 obteniendo 


log y = f, log x + log Q, (7.16) 


De este modo, una gráfica de log y contra log x dará una línea recta con pendiente $, e intersección 
con el eje de las ordenadas log «, (figura 17.9e). 
La ecuación (17.14) es linealizada al invertirla para dar 


1_B1,1 (17.17) 
y Ox a, 


De esta forma, una gráfica de 1/y contra 1/x será lineal, con pendiente $y/a, y una intersección con 
el eje de las ordenadas 1/a; (figura 17.9f). 

En sus formas transformadas, estos modelos pueden usar la regresión lineal para poder evaluar 
los coeficientes constantes. Después, regresarse a su estado original y usarse para fines predictivos. 
El ejemplo 17.4 ilustra este procedimiento con la ecuación (17.13). Además, la sección 20.1 propor- 
ciona un ejemplo de ingeniería de la misma clase de cálculo. 


EJEMPLO 17.4  Linealización de una ecuación de potencias 


Planteamiento del problema Ajuste la ecuación (17.13) a los datos de la tabla 17.3 mediante 
una transformación logarítmica de los datos. 


Solución La figura 17.10a es una gráfica de los datos originales en su estado no transformado. La 
figura 17.10b muestra la gráfica de los datos transformados. Una regresión lineal de esta transfor- 
mación mediante logaritmos dan el siguiente resultado: 
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Tabla 17.3 Datos que se ajustarán con la ecuación de potencias. 


x y log x log y 
1 0.5 0 0.301 
2 l:7: 0.301 0.226 
3 3.4 0.477 0.534 
4 5.7 0.602 0.753 
3 


8.4 0.699 0.922 


log y 4 


0.5 


=Y 
—< 


b) 


Figura 17.10 
a) Gráfica de datos no transformados con la ecuación de potencias que se ajusta a los datos. b) Gráfica 
de datos transformados para determinar los coeficientes de la ecuación de potencias. 


log y = 1.75 log x — 0.300 


Así, la intersección con el eje de las ordenadas es log «, igual a —-0.300 y, por lo tanto, al tomar el 
antilogaritmo, «2, = 107% =.5. La pendiente es $,= 1.75. En consecuencia, la ecuación de potencias 
es 


y=0.51175 


Esta curva, como se grafica en la figura 17.10a, indica un buen ajuste. 


17.1.6 Comentarios generales sobre la regresión lineal 


Antes de plantear la regresión curvilínea y lineal múltiple, debemos enfatizar la naturaleza introduc- 
toria del material anterior sobre regresión lineal. Nos hemos concentrado en la obtención y el uso 
práctico de ecuaciones para ajustarse a datos. Deberá estar consciente del hecho de que hay aspectos 
teóricos de regresión que son de importancia práctica, pero que van más allá del alcance de este libro. 
Por ejemplo, algunas suposiciones estadísticas, inherentes a los procedimientos lineales por mínimos 
cuadrados, son 


1. Cada x tiene un valor fijo; no es aleatorio y se conoce sin error. 
2. Los valores de y son variables aleatorias independientes y todas tienen la misma varianza. 
3. Los valores de y para una x dada deben estar distribuidos normalmente. 


Tales suposiciones son relevantes para la obtención adecuada y el uso de la regresión. Por ejem- 
plo, la primera suposición significa que 1) los valores x deben estar libres de errores, y 2) la regresión 
de y contra x no es la misma que la de x contra y (véase el problema 17.4 al final del capítulo). Usted 
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debe consultar otras referencias como Draper y Smith (1981) para apreciar los aspectos y detalles de 
la regresión que están más allá del alcance de este libro. 


17.2 REGRESIÓN POLINOMIAL 


En la sección 17.1 se desarrolló un procedimiento para obtener la ecuación de una línea recta por 
medio del criterio de mínimos cuadrados. En la ingeniería, aunque algunos datos exhiben un patrón 
marcado, como el que se advierte en la figura 17.8, son pobremente representados por una línea 
recta, entonces, una curva podrá ser más adecuada para ajustarse a los datos. Como se analizó en 
la sección anterior, un método para lograr este objetivo es utilizar transformaciones. Otra alternati- 
va es ajustar polinomios a los datos mediante regresión polinomial. 

El procedimiento de mínimos cuadrados se puede extender fácilmente al ajuste de datos con un 
polinomio de grado superior. Por ejemplo, suponga que ajustamos un polinomio de segundo grado 
o cuadrático: 


y=a) +ax+ax+e 


En este caso, la suma de los cuadrados de los residuos es [compare con la ecuación (17.3)] 
S, = > O, = 4, 41x;= a,x; y (17.18) 
i=l 


Al seguir el procedimiento de la sección anterior, obtenemos la derivada de la ecuación (17.18) con 
respecto a cada uno de los coeficientes desconocidos del polinomio, 


9S, 2 
da, > y (y; — ay — a,x, — 4,x;) 
0S, E 2 
da, > y 1,0, 4, —a,x,—a,x;) 
os, _ 2 2 
da, = y x; (y; — 4) — 4,x,— 47x; ) 


Estas ecuaciones se igualan a cero y se reordenan para desarrollar el siguiente conjunto de ecuacio- 
nes normales: 


(ma, + (Y x,)a +) x 
(> x,) a, +(d, 17) a, +[), =>) E (17.19) 
Eojel sal sa -Y a 


donde todas las sumatorias van desde ¡ = 1 hasta n. Observe que las tres ecuaciones anteriores son 
lineales y tienen tres incógnitas: a, a, y a,. Los coeficientes de las incógnitas se evalúan de mane- 
ra directa, a partir de los datos observados. 

En este caso, observamos que el problema de determinar un polinomio de segundo grado por 
mínimos cuadrados es equivalente a resolver un sistema de tres ecuaciones lineales simultáneas. 
En la parte tres se estudiaron las técnicas para resolver tales ecuaciones. 

El caso bidimensional se extiende con facilidad a un polinomio de m-ésimo grado como sigue 


NSZAFAX+a +A +0, 0" +e 


El análisis anterior se puede extender fácilmente a este caso más general. Así, se reconoce que la 
determinación de los coeficientes de un polinomio de m-ésimo grado es equivalente a resolver un 
sistema de m + 1 ecuaciones lineales simultáneas. En este caso, el error estándar se formula como 
sigue: 
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S. 
y 17.20 
Sy Vn—-(m+1) ( ) 


Esta cantidad se dividide entre n — (m + 1), ya que (m + 1) coeficientes obtenidos de los datos, a, 
A1»..., 4,,, Se utilizaron para calcular S,; hemos perdido m + 1 grados de libertad. Además del error 
estándar, también se calcula un coeficiente de determinación para la regresión polinomial con la 
ecuación (17.10). 


EJEMPLO 17.5 Regresión polinomial 


Planteamiento del problema Ajustar a un polinomio de segundo grado los datos dados en las 
dos primeras columnas de la tabla 17.4. 


Solución A partir de los datos dados, 
m=2 ais SY 1! =979 
n=6 Y y =1526 Y x,y,=585.6 


=2,5 Y 1i=55 Y x/y,=2488.8 


y=25433 Y x)=225 


Tabla 17.4 Cálculos para un análisis de error del ajuste cuadrático por mínimos cuadrados. 


Parábola 


X; Y; (y, - yY (y,- ap - ax; - ar rY 
0 2.1 544.44 0.14332 
1 7.7 314.47 1.00286 
2 13.6 140.03 1.08158 
3 27.2 3.12 0.80491 
4 40.9 239.22 0.61951 
5 61.1 1272.11 0.09439 
Y 152.6 2513.39 3.74657 
Entonces, las ecuaciones lineales simultáneas son 
6 15 55|la, 152.6 
15 55 225|3a,p=3 585.6 
de mínimos 55 225 979||a, 2 488.8 


cuadrados 


Resolviendo estas ecuaciones con una técnica como la eliminación de Gauss 
se tiene ay = 2.47857, a, = 2.35929 y a, = 1.86071. Por lo tanto, la ecuación 
cuadrática por mínimos cuadrados en este caso es 


y = 2.47857 + 2.35929x + 1.86071x7 


El error estándar de la estimación con base en la regresión polinomial es [ecua- 
ción (17.20)] 


Figura 17.11 


al 
=Y 


es pr ia 


Ajuste de un polinomio de segundo grado. 


El coeficiente de determinación es 
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2 2513.39-3.74657 
2 513.39 


=0.99851 


y el coeficiente de correlación es r =0.99925, 

Estos resultados indican que con el modelo se explicó el 99.851% de la incertidumbre original. 
Este resultado apoya la conclusión de que la ecuación cuadrática representa un excelente ajuste, como 
también es evidente en la figura 17.11. 


17.2.1 Algoritmo para la regresión polinomial 


Un algoritmo para la regresión polinomial se expone en la figura 17.12. Observe que la principal 
tarea es la generación de los coeficientes de las ecuaciones normales [ecuación (17.19)]. (El pseu- 
docódigo para esto se presenta en la figura 17.13.) Las técnicas de la parte tres sirven para resolver 
estas ecuaciones simultáneas que determinan los coeficientes. 


Paso 1: Introduzca el grado del polinomio sujeto a ajuste, M. 

Paso 2: Introduzca el número de datos, N. 

Paso 3: Si n < m+ 1, imprima un mensaje de error que indique que la regresión no es posible 
y termine el proceso. Si n > m + 1, continúe. 

Paso 4: Calcule los elementos de la ecuación normal en la forma de una matriz aumentada. 

Paso 5: Usando la matriz aumentada determine los coeficientes ay, a;, d»,..., Am, por medio de 
un método de eliminación. 

Paso 6: Imprima los coeficientes. 


Figura 17.12 
Algoritmo para implementar la regresión polinomial y lineal múltiple. 


Un problema potencial en la implementación de la regresión polinomial en la computadora es 
que las ecuaciones normales algunas veces están mal condicionadas. Esto se presenta especialmen- 
te cuando se plantean polinomios de grado superior. En tales casos, los coeficientes calculados 
pueden ser altamente susceptibles al error de redondeo y, en consecuencia, los resultados serían 
inexactos. Entre otras cuestiones, este problema se relaciona con la estructura de las ecuaciones 
normales y con el hecho de que con polinomios de grado superior las ecuaciones normales pueden 
tener coeficientes muy grandes y muy pequeños. Lo anterior se debe a que los coeficientes son sumas 
de datos elevados a potencias. 

Aunque las estrategias para disminuir el error de redondeo 
analizadas en la parte tres, como el pivoteo, pueden ayudar a resol- 


ver parcialmente dicho problema, una alternativa más simple con- DOFOR 1 = 1, order + 1 
siste en usar una computadora con alta precisión. Por fortuna, la DOFOR J e 1, Ú 
mayoría de los problemas prácticos están limitados a polinomios de k=1+J=2 
grado inferior, en los cuales el error de redondeo generalmente es sum = 0 
insignificante. En situaciones donde se requieren versiones de grado DOFOR € = 1, n 
superior, se dispone de otras alternativas para ciertos tipos de datos. sum = sum + x( 
Sin embargo, esas técnicas (como polinomios ortogonales) están más END DO 
allá del alcance de este libro. El lector deberá consultar textos sobre di 
regresión, como el de Draper y Smith (1981), para mayor información dj = SUM 
respecto al problema y sus posibles alternativas. END DO 

sum= 0 

DOFOR € = 1, n 
Figura 17.13 sum = sum+ y. + xp? 
Pseudocódigo para encontrar los elementos de las ecuaciones nor- END DO 
males en la regresión polinomial. Arorderrz = SUM 


END DO 
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17.3 REGRESIÓN LINEAL MÚLTIPLE 


Una extensión útil de la regresión lineal es el caso en el que y es una función lineal de dos o más 
variables independientes. Por ejemplo, y podría ser una función lineal de x, y x,, como en 


y = 49+ 0/X, + 0,X, +€ 


En particular tal ecuación es útil cuando se ajustan datos experimentales donde la variable sujeta a 
estudio es una función de otras dos variables. En este caso bidimensional, la “línea” de regresión se 
convierte en un “plano” (figura 17.14). 
Como en los casos anteriores, los “mejores” valores para los coeficien- 
tes se determinan al realizar la suma de los cuadrados de los residuos, 


y A n a 
S, = y (O; — Ay — 4¡X,; — 47X>¡)" (17.21) 
i=l 
y derivando con respecto a cada uno de los coeficientes desconocidos, 
! 
I 
IS 9S, 
ÓN y (); — 4, — ,X;; — 4,X;) 
da, 
9 7 El os, 
OST =2, Xy¡ (Y; — Ay — 4,X,; — 4,X,,) 
/ da, 
e 
/ aS 
e > y X2¡ (Y; — Ay — 0,X,; — 4,X,,) 
da, 
ho Los coeficientes que dan la suma mínima de los cuadrados de los residuos 
se obtienen al igualar a cero las derivadas parciales y expresando el resul- 
Figura 17.14 tado en forma matricial: 
Descripción gráfica de una regresión lineal múlti- 
ple donde y es una función lineal de x, y x,. e 2Xy, 2x, ||[a) 2), 
2 Xy, Lx 2 XX [99 (=3 21,9, (17.22) 


2 
Xy Xt LA a, 2 


EJEMPLO 17.6 Regresión lineal múltiple 


Planteamiento del problema Los siguientes datos se calcularon con la ecuación y=5 + 4x, —3x,: 


¡SAN NO 
ul 

NDWN=0 
o 


Utilice la regresión lineal múltiple para ajustar estos datos. 


Solución Las sumatorias requeridas para la ecuación (17.22) se calculan en la tabla 17.5. El resul- 
tado es 


6 165 14]Ía, 54 
16.5 76.25 48 |/a,p=4243.5 
14 48 54 |la, 100 
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que se resuelve mediante un método como el de eliminación de Gauss, obteniéndose 
ay=5 aj=4 a,=3 


que es consistente con la ecuación original, de la cual se obtienen los datos. 


Tabla 17.5 Cálculos requeridos para desarrollar las ecuaciones normales para el ejemplo 


17.6. 

y X1 X x a xx xy xy 

5 0 0 0 0 0 0 0 

10 2 1 4 1 Z 20 10 

9 2.5 2 6.25 4 5 22.5 18 

0 1 3 1 9 3 0 0 

3 6 16 36 24 12 18 

27 7 2 49 4 14 189 54 

Y 54 16.5 14 76.25 54 48 243.5 100 


El caso bidimensional anterior fácilmente se extiende a m dimensiones así 


Yy=4y+ 01X, + 09X) + +05 +e 


donde el error estándar se formula como 


Ea 
Sox > 
n-(m+1) 


DOFOR ¡ = 1, order + 1 
DOFOR j = 1, 1 
sum = 
DOFOR € = 1, n 
SUM = SUM + Xi-ze, * Xjzo 


END DO 
dr sum 
dj; = Sum 
END DO 
sun — 0 Figura 17.15 
DOFOR £ = 1, n Pseudocódigo para establecer los elementos de las ecuacio- 
sum = SUM + Ye * Xi-ie nes normales en la regresión múltiple. Observe que además 
END DO de guardar las variables independientes en x, , x,, etC., se 
Avorders2 = SUM deben guardar 1 en x,, para que funcione este algoritmo. 
END DO 


y el coeficiente de determinación se calcula como en la ecuación (17.10). En la figura 17.15 se da un 


algoritmo para establecer las ecuaciones normales. 
Aunque puede haber ciertos casos donde una variable esté linealmente relacionada con dos o 
más variables, la regresión lineal múltiple tiene además utilidad en la obtención de ecuaciones de 


potencias de la forma general 


Um 


== a 4, 
Y AX O tt Xp 


Tales ecuaciones son extremadamente útiles cuando se ajustan datos experimentales. Para usar re- 
gresión lineal múltiple, la ecuación se transforma al aplicar logaritmos: 


log y = log a, + a, log x, + a, log x, + ++ + 4,, 108 x,, 
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Esta transformación es similar a la que se usó en la sección 17.1.5 y en el ejemplo 17.4 para 
ajustar una ecuación de potencias cuando y era una función de una sola variable x. La sección 20.4 
muestra un ejemplo de una de estas aplicaciones para dos variables independientes. 


17.4 MÍNIMOS CUADRADOS LINEALES EN GENERAL 


Hasta aquí nos hemos concentrado en la mecánica para obtener ajustes por mínimos cuadrados de 
algunas funciones sencillas para datos dados. Antes de ocuparnos de la regresión no lineal, hay varios 
puntos que nos gustaría analizar para enriquecer nuestra comprensión del material precedente. 


17.4.1 Formulación general de una matriz para mínimos 
cuadrados lineales 


En las páginas anteriores presentamos tres tipos de regresión: lineal simple, polinomial y lineal 
múltiple. De hecho, las tres pertenecen al siguiente modelo lineal general de mínimos cuadrados: 


Y = AyZo + 4121 + 22H + +++ OZ + € (17.23) 
donde Zo, Z1, --- , Z, SON M+ 1 funciones diferentes. Se observa con facilidad cómo la regresión lineal 
simple y múltiple se encuentran dentro de este modelo; es decir, zp = 1,2, =X¡, Z2=X», -..> Zy = Xyp> 


Además, la regresión polinomial se incluye también si las z son monomios simples como z,=x%= 1, 
HELL = 10% 

Observe que la terminología “lineal” se refiere sólo a la dependencia del modelo sobre sus pa- 
rámetros (es decir, las a). Como en el caso de la regresión polinomial, las mismas funciones llegan 


a ser altamente no lineales. Por ejemplo, las z pueden ser senoidales, como en 
y = 4, + a, Cos (wt) + a, sen (wt) 


Esta forma es la base del análisis de Fourier que se describe en el capítulo 19. 
Por otro lado, un modelo de apariencia simple como 


fo =a (1-e*”) 


es no lineal porque no es posible llevarlo a la forma de la ecuación (17.23). Regresaremos a tales 
modelos al final de este capítulo. 
Mientras tanto, la ecuación (17.23) se expresa en notación matricial como 


(1) = [Z1(4) + (E) (17.24) 


donde [Z] es una matriz de los valores calculados de las funciones z en los valores medidos de las 
variables independientes, 


Za 11 Z ml 
Zo “12 Zm2 

[Z]= 
zo Zin qn Z mn 


donde m es el número de variables en el modelo y n es el número de datos. Como n > m + 1, usted 
reconocerá que, la mayoría de las veces, [Z] no es una matriz cuadrada. 
El vector columna (Yj] contiene los valores observados de la variable dependiente 


Wrsly y > y) 
El vector columna (4) contiene los coeficientes desconocidos 


(4=La, a; ¡A al 
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y el vector columna (E) contiene los residuos 
(Ey=L e, é2 O €) 


Como se dio a lo largo de este capítulo, la suma de los cuadrados de los residuos en este mode- 
lo se definen como 


m 


S,= y Yi 9 En 
i=l 


¡20 


Esta cantidad se minimiza tomando las derivadas parciales con respecto a cada uno de los coeficien- 
tes e igualando a cero la ecuación resultante. El resultado de este proceso son las ecuaciones norma- 
les, que se expresan en forma matricial como 


UZPIZICA) = IZ) (17.25) 


Es posible mostrar que la ecuación (17.25) es, de hecho, equivalente a las ecuaciones normales desa- 
rrolladas antes para la regresión lineal simple, la polinomial y la múltiple. 

Nuestra principal motivación para lo anterior fue ilustrar la unidad entre los tres procedimientos 
y mostrar cómo se pueden expresar de manera simple en la misma notación matricial. La notación 
matricial también tendrá relevancia cuando volvamos a la regresión no lineal en la última sección del 
presente capítulo. 

De la ecuación (PT3.6), recuerde que se puede usar la inversa de la matriz para resolver la 
ecuación (17.25) como en 


(4) = IZATZI" = (IZ) (17.26) 


Como se aprendió en la parte tres, éste es un enfoque ineficiente para resolver un sistema de ecuaciones 
simultáneas. Sin embargo, desde la perspectiva estadística, hay varias razones por las que podría inte- 
resar obtener la inversa y examinar sus coeficientes. Estas razones se explicarán en seguida. 


17.4.2 Aspectos estadísticos de la teoría de mínimos cuadrados 


En la sección PT5.2.1 revisamos diversos estadísticos descriptivos que se utilizan para describir una 
muestra. Éstos son: la media aritmética, la desviación estándar y la varianza. 

Además de dar una solución para los coeficientes de regresión, la formulación matricial de la 
ecuación (17.26) proporciona estimaciones de sus estadísticos. Es posible demostrar (Draper y Smi- 
th, 1981) que los términos en la diagonal y fuera de la diagonal de la matriz [[Z]* [Z]]* dan, respec- 
tivamente, las varianzas y las covarianzas' de las a. Si los elementos de la diagonal de [[Z]* [Z1]7 
se designa por z;;, entonces 


var(a,1) = ¿Sr (17.27) 
de 

covla, di) = 7 5 (17.28) 

Dichos estadísticos poseen varias aplicaciones importantes. Para nuestros actuales propósitos, 
ilustraremos cómo se utilizan para desarrollar intervalos de confianza para la intersección con el eje 
y y la pendiente. 

Con un procedimiento similar al examinado en la sección PT5.2.3, se demuestra que los límites 
inferior y superior para la intersección con el eje y se pueden encontrar (véase Milton y Arnold, 1995, 
para más detalles) de la siguiente manera: 


L=49-— tj n-25(0p) U= 49 + la n-25(4p) (17.29) 


'La covarianza es un estadístico que mide la dependencia de una variable respecto de otra. Así, cov(x, y) indica la dependencia 
de x y y. Por ejemplo, cov(x, y) = O indicaría que x y y son totalmente independientes. 
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donde s(a;) = el error estándar del coeficiente a, = Vvar(a;). De manera similar, los límites inferior 
y superior para la pendiente se calculan: 


L= 4; — aj p 25(41) U= 4, + La n 5(4,) (17.30) 


El ejemplo 17.7 ilustra cómo se emplean esos intervalos para realizar inferencias cuantitativas res- 
pecto a la regresión lineal. 


EJEMPLO 17.7 Intervalos de confianza para la regresión lineal 


Planteamiento del problema En el ejemplo 17.3 utilizamos la regresión para desarrollar la 
siguiente relación entre mediciones y predicciones del modelo: 


y =-0.859 + 1.032x 


donde y = las predicciones del modelo y x = las mediciones. Concluimos que había una buena con- 
cordancia entre las dos, puesto que la intersección con el eje y era aproximadamente igual a 0, y la 
pendiente aproximadamente igual a 1. Vuelva a calcular la regresión, pero ahora use el método 
matricial para estimar los errores estándar de los parámetros. Después emplee tales errores para 
desarrollar los intervalos de confianza y úselos para realizar un planteamiento probabilístico res- 
pecto a la bondad del ajuste. 


Solución Los datos se escriben en forma matricial para una regresión lineal simple de la siguien- 
te manera: 


1 107 8.953 
1 163 16.405 
1 23 22.607 
[Zl=[- + | (7= 
[150 | 49.988 


Después se usan la transposición y la multiplicación matriciales para generar las ecuaciones normales: 


[IZ'[Z1] (4) =(IZ1'M)) 
15 548.3 a) | | 552.741 
548.3 22191.21 a | |22421.43 
Se emplea la inversión matricial para obtener la pendiente y la intersección con el eje y 


(4)= PAMPA DS (IZ) 
xl 0.688414 —0.01701 552.741 ñ —0.85872 
=1-0.01701 0.000465 22 421.43/ |1.031592 


De esta manera, la intersección con el eje y y la pendiente quedan como a, =-—0.83872 y a, = 1.031592, 
respectivamente. Estos valores, a su vez, sirven para calcular el error estándar del estimado, s,,, = 


yx 


0.863403. Este valor puede utilizarse, junto con los elementos diagonales de la matriz inversa, para 
calcular los errores estándar de los coeficientes, 


s(a,)= 25157, =+/0.688414(0.863403) =0.716372 


s(a,)=,[2725i,, =4/0.000465(0.863403)” =0.018625 


y/x 


17.5 Regresión no lineal 


El estadístico f,,¡, , Necesario para un intervalo de confianza del 95% conn-2=15-2=13 
grados de libertad se obtiene con una tabla estadística o mediante software. Usemos una función de 
Excel, TINV, para obtener el valor adecuado de la siguiente manera: 


= TINV(0.05, 13) 


que da un valor de 2.160368. Las ecuaciones (17.29) y (17.30) entonces se usan para calcular los 
intervalos de confianza: 
A, = -0.85872 + 2.160368(0.716372) 
= -0.85872 + 1.547627 = [-2.40634, 0.688912] 
a, = 1.031592 + 2.160368(0.018625) 
= 1.031592 + 0.040237 = [0.991355, 1.071828] 


Observe que los valores deseados (0 para la intersección y la pendiente y 1 para la intersección) 
caen dentro de los intervalos. Considerando este análisis podremos formular las siguientes declara- 
ciones sobre la pendiente: tenemos fundamentos sólidos para creer que la pendiente de la línea de 
regresión real está dentro del intervalo de 0.9913553 a 1.071828. Debido a que 1 está dentro de este 
intervalo, también tenemos fundamentos sólidos para creer que el resultado apoya la concordancia 
entre las mediciones y el modelo. Como cero está dentro del intervalo de la intersección, se puede 
hacer una declaración similar respecto a la intersección. 


Como se mencionó antes en la sección 17.2.1, las ecuaciones normales son notoriamente inade- 
cuadas. Por lo tanto, si se resuelven con técnicas convencionales como la descomposición de LU, los 
coeficientes calculados pueden ser muy propensos a errores de redondeo. En consecuencia, para 
darle la vuelta al problema, hay disponibles algoritmos más tecnificados de ortogonalización como 
la factorización OR. Como estas técnicas están más allá del alcance de este libro, el lector debe 
consultar textos sobre regresión, como Draper y Smith (1981) para información adicional acerca del 
problema y posibles alternativas. Moler (2004) también ofrece una buena explicación del tema, 
poniendo énfasis en los métodos numéricos. 

Lo anterior es una introducción limitada al rico tema de la inferencia estadística y su relación 
con la regresión. Hay muchas sutilezas que rebasan el alcance de este libro, cuya motivación princi- 
pal ha sido ilustrar la potencia del enfoque matricial a los mínimos cuadrados lineales generales. 
Además, se debe observar que paquetes de software como Excel, MATLAB y Mathcad pueden 
generar ajuste de datos de regresión por mínimos cuadrados junto con información de importancia 
para la inferencia estadística. Se explorarán algunas de estas capacidades cuando se describan estos 
paquetes al final del capítulo 19. 


17.5 REGRESIÓN NO LINEAL 


Hay muchos casos en la ingeniería donde los modelos no lineales deben ajustarse a datos. En el 
presente contexto, tales modelos se definen como aquellos que tienen dependencia no lineal de sus 
parámetros. Por ejemplo, 


Fo) =aJ 1 -en5)+e (17.30) 


Esta ecuación no puede ser manipulada para ser llevada a la forma general de la ecuación (17.23). 

Como en el caso de los mínimos cuadrados lineales, la regresión no lineal se basa en la deter- 
minación de los valores de los parámetros que minimizan la suma de los cuadrados de los residuos. 
Sin embargo, en el caso no lineal, la solución debe realizarse en una forma iterativa. 

El método de Gauss-Newton es un algoritmo para minimizar la suma de los cuadrados de los 
residuos entre los datos y las ecuaciones no lineales. El concepto clave detrás de esta técnica es que 
se utiliza una expansión en serie de Taylor para expresar la ecuación no lineal original en una forma 
lineal aproximada. Entonces, es posible aplicar la teoría de mínimos cuadrados para obtener nuevas 
estimaciones de los parámetros que se mueven en la dirección que minimiza el residuo. 
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Para ilustrar cómo se logra esto, primero se expresa de manera general la relación entre la ecua- 
ción no lineal y los datos, de la manera siguiente: 


Y; =/(X;3 Ag, Aj, ... , Am) + €; 
donde y, = un valor medido de la variable dependiente, f(x;; Ap, 4;, ... , 4, ) = la ecuación que es una 
función de la variable independiente x, y una función no lineal de los parámetros a, 4, ... , A, Y €,= 


un error aleatorio. Por conveniencia, este modelo se expresa en forma abreviada al omitir los parámetros, 
y, = f(x) + e, (17.32) 
El modelo no lineal puede expandirse en una serie de Taylor alrededor de los valores de los pa- 


rámetros y cortarse después de las primeras derivadas. Por ejemplo, para un caso con dos parámetros, 


IG), 
A (17.33) 
da, da, 


UC 7 xp), + 


donde ¡ = el valor inicial, ¡ + 1= la predicción, AÁa¿= 4p;,1— o; y Aa, = a; ;, 1-1 De esta forma, 
hemos linealizado el modelo original con respecto a los parámetros. La ecuación (17.33) se sustitu- 
ye en la ecuación (17.32) para dar 


A) Aa, + 0), Aa, +e, 
da, da, 


YH), a 


o en forma matricial [compárela con la ecuación (17.24)], 
(0) =[Z,1(A4) + (E) (17.34) 
donde [Z;] es la matriz de las derivadas parciales de la función evaluadas en el valor inicial j, 


Fof,lda,  df/da, | 
of,/da, of, /da, 


L0f,/0a, of, /da, | 


donde n = el número de datos y of,/da, = la derivada parcial de la función con respecto al k-ésimo 
parámetro evaluado en el ¡-ésimo dato. El vector (D) contiene las diferencias entre las mediciones 
y los valores de la función, 


y = f(x) 
y, =$ (x,) 
(0) = 
Y 7 (5) 
y el vector [AA] contiene los cambios en los valores de los parámetros, 
Aa, 
Aa, 


(44) = 


Aa 


m 


17.5 Regresión no lineal 


Si se aplica la teoría de los mínimos cuadrados lineales a la ecuación (17.34) se obtienen las siguien- 
tes ecuaciones normales [recuerde la ecuación (17.25)]: 


[ZIZ,11(44) = (1Z11D)) (17.35) 
Así, el procedimiento consiste en resolver de la ecuación (17.35) para [AA], que se utiliza para cal- 
cular valores mejorados de los parámetros, como en 


Aoj+1= Ap ¿+ Aa, 


Ay j+1=41/+ Aa, 
Este procedimiento se repite hasta que la solución converge, es decir, hasta que 


Arujrr Aj 


100% (17.36) 


a 


Arjrt 


está por debajo de un criterio de terminación aceptable. 


EJEMPLO 17.8 Método de Gauss-Newton 


Planteamiento del problema Ajuste la función f(x; ay, a,) = ay(1 — e“) a los datos: 


xo] 025 075 125 175 225 
y Í 028 057 068 0.74 0.79 


Emplee a,= 1.0 y a, = 1.0 como valores iniciales para los parámetros. Observe que para estos valo- 
res la suma inicial de los cuadrados de los residuos es 0.0248. 


Solución Las derivadas parciales de la función con respecto a los parámetros son 


Y, 


rar (E17.8.1) 
das, 


—=qyxe " (E17.8.2) 


Las ecuaciones (E17.8.1) y (E17.8.2) se utilizan para evaluar la matriz 


0.2212 0.1947 
0.5276 0.3543 
[Z,]=|0.7135 0.3581 
0.8262 0.3041 
0.8946 0.2371 


Esta matriz multiplicada por su transpuesta nos da 


0.9489 0.4404 


F 2.3193 0.9489 
[Zo] i2o1=| | 


la cual, a su vez, se invierte con el siguiente resultado: 


ado 3.6397 7.8421 
A 821: 10:1678 
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El vector (D) consiste en las diferencias entre las mediciones y las predicciones del modelo, 


0.28-0.2212 0.0588 
0.57—0.5276 0.0424 
(Dy=40.68-0.7135)=+-0.0335 
0.74-0.8262|  |-0.0862 
0.79-0.8946|  |-0.1046 


Éste se multiplica por [Z¿]” para dar 


E -0.1533 
[2,1 1D) -| | 


0.0365 


El vector (AA), entonces, se calcula al resolver la ecuación (17.35): 
0.2714 
AA = 
0.5019 
que se suma a los valores iniciales de los parámetros: 


4, 1.0 0.2714 0.7286 
= + = 
a, 1.0 0.5019 1.5019 


Así, los estimados mejorados de los parámetros son a, = 0.7286 y a, = 1.5019. Los nuevos parámetros 
dan una suma de los cuadrados de los residuos igual a 0.0242. La ecuación (17.36) se utiliza para 
obtener que e, y e, son iguales a 37 y 33%, respectivamente. El cálculo se repetiría hasta que esos 
valores estén abajo del criterio de terminación establecido. El resultado final es a, = 0.79186 y a, = 
1.6751. Tales coeficientes dan una suma de los cuadrados de los residuos de 0.000662. 


Un problema potencial con el método de Gauss-Newton, como se ha desarrollado hasta ahora, 
es que las derivadas parciales de la función pueden ser difíciles de evaluar. En consecuencia, muchos 
programas computacionales usan diferentes ecuaciones para aproximar las derivadas parciales. Un 
método es 


Of. _ F(X,507,...,4, +04,,...,0,)= [(X,50p ...Ajs...,A,,) 
da, ón, 


(17.37) 


donde Ó = una perturbación fraccional pequeña. 
El método de Gauss-Newton tiene también algunas desventajas: 


1. Puede converger con lentitud. 
2. Puede oscilar ampliamente; es decir, cambia de dirección continuamente. 
3. Puede no converger. 


Se han desarrollado modificaciones del método (Booth y Peterson, 1958; Hartley, 1961) para dismi- 
nuir las desventajas. 

Además, aunque hay varios procedimientos expresamente diseñados para regresión, un método 
más general es usar rutinas de optimización no lineal como las descritas en la parte cuatro. Para 
hacer esto, se dan valores iniciales a los parámetros y se calcula la suma de los cuadrados de los 
residuos. Por ejemplo, para la ecuación (17.31) esto se podría calcular como 


n 


S,=Y Dd, -ad-e my (17.38) 


i=1 
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Los parámetros, entonces, se ajustarían de manera sistemática para minimizar $, mediante técnicas 
de búsqueda como las descritas previamente en el capítulo 14. llustraremos el modo para hacer esto 
cuando describamos las aplicaciones de software, al final del capítulo 19. 


PROBLEMAS 


17.1 Dados los siguientes datos 


8.8 9.5 9.8 9.4 10.0 
9.4 10.1 9.2 11.3 9.4 
10.0 10.4 7.9 10.4 9.8 
9.8 9.5 8.9 8.8 10.6 
10.1 9.5 9.6 10.2 8.9 


determine a) la media, b) la desviación estándar, c) la varianza, d) el 
coeficiente de variación y e) el intervalo de confianza de 95% para 
la media. f) Construya un histograma usando un rango de 7.5 a 11.5 
con intervalos de 0.5. 
17.2 Dados los datos 


29.65 28.55 28.65 30.15 29.35 29.75 29.25 
30.65 28.15 29.85 29.05 30.25 30.85 28.75 
29.65 30.45 29.15 30.45 33.65 29.35 29.75 
31.25 29.45 30.15 29.65 30.55 29.65 29.25 


Determine a) la media, b) la desviación estándar, c) la varianza, d) 
el coeficiente de variación y e) el intervalo de confianza del 90% para 
la media. f) Construya un histograma. Use un rango de 28 a 34 con 
incrementos de 0.4. g) Si se supone que la distribución es normal y 
que la estimación de la desviación estándar es válida, calcule el 
rango (es decir, los valores inferior y superior) que agrupa al 68% de 
los datos. Determine si ésta es una estimación válida para los datos 
del problema. 

17.3 Utilice la regresión por mínimos cuadrados para ajustar una 
línea recta a 


12 15 17 19 
6 6 9 8 7 10 12 12 


lan 
N 
N | 
n 
o 
= 


Xx 
y | 
Además de la pendiente y la intersección, calcule el error estándar 
de la estimación y el coeficiente de correlación. Haga una gráfica de 
los datos y la línea de regresión. Después repita el problema, pero 
ahora efectúe la regresión de x versus y, es decir, intercambie las 
variables. Interprete sus resultados. 


17.4 Use la regresión por mínimos cuadrados para ajustar una línea 
recta a 


x| 6 7 11 15 17 21 23 29 29 37 39 
y|29 21 29 14 21 15 7 7 13 0 3 


Además de la pendiente y la intersección, calcule el error estándar 
de la estimación y el coeficiente de correlación. Haga una gráfica de 
los datos y la línea de regresión. ¿Si otra persona hiciera una medición 
adicional de x= 10, y= 10, usted pensaría, con base en una evaluación 
visual y el error estándar, que la medición era válida o inválida? 
Justifique su conclusión. 


17.5 Con el mismo enfoque que se empleó para obtener las ecuacio- 
nes (17.15) y (17.16), obtenga el ajuste por mínimos cuadrados del 
modelo siguiente: 


y=ax+e 


Es decir, determine la pendiente que resulta en el ajuste por mínimos 
cuadrados para una línea recta con intersección en el origen. Ajuste 
los datos siguientes con dicho modelo e ilustre el resultado con una 
gráfica: 


x | 2 4 6 7 10 11 14 17 20 
y|1o02. 05. 2. 8 7 6 9 12 


17.6 Emplee la regresión por mínimos cuadrados para ajustar una 
línea recta a 


a) Además de la pendiente y la intersección, calcule el error estándar 
de la estimación y el coeficiente de correlación. Grafique los 
datos y la línea recta. Evalúe el ajuste. 

b) Vuelva a hacer el cálculo del inciso a), pero use regresión 
polinomial para ajustar una parábola a los datos. Compare los 
resultados con los del inciso a). 

17.7 Ajuste los datos siguientes con a) un modelo de tasa de creci- 
miento de saturación, b) una ecuación de potencias y c) una parábo- 
la. En cada caso, haga una gráfica de los datos y la ecuación. 


| 075 2 3 4 6 8 8.5 
195 2 A A 


17.8 Ajuste los datos siguientes con el modelo de potencias 
(y = ax”). Use la ecuación de potencias resultante para hacer el pro- 
nóstico de y en x=9. 


x [25 SS 6 75 10 125 15 175 20 
y | 13 11 85 82 7 62 52 48 46 43 


17.9 Ajuste a un modelo exponencial a 


[corts es LES A 
975 1500 1950 2900 3600 


Grafique los datos y la ecuación tanto en papel milimétrico como en 
semilogarítmico. 

17.10 En vez de usar el modelo exponencial de base e (ecuación 
17.22), una alternativa común consiste en utilizar un modelo de base 
10. 
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y =a,10% 


Cuando se usa para ajustar curvas, esta ecuación lleva a resultados 
idénticos que los de la versión con base e, pero el valor del parámetro 
del exponente ($5) difiere del estimado con la ecuación (17.22) (6). 
Use la versión con base 10 para resolver el problema 17.9. Además, 
desarrolle una formulación para relacionar $, con fs. 

17.11 Además de los ejemplos de la figura 17.10, existen otros 
modelos que se pueden hacer lineales con el empleo de transforma- 
ciones. Por ejemplo, 


y = 0 xebs* 


Haga lineal este modelo y úselo para estimar «*, y f, con base en los 
datos siguientes. Elabore una gráfica del ajuste junto con los datos. 


x [01 02 04 06 09 13 15 17 18 
y |o.75 1.25 1.45 125 085 0.55 0.35 0.28 0.18 


17.12 Un investigador informa sobre los datos tabulados a continua- 
ción de un experimento para determinar la tasa de crecimiento de 
bacterias k (por día), como función de la concentración de oxígeno 
c (mg/L). Se sabe que dichos datos pueden modelarse por medio de 
la ecuación siguiente: 


KmáxC2 
cs +02 
donde c, y K.,s, SON parámetros. Use una transformación para hacer 


lineal esta ecuación. Después utilice regresión lineal para estimar c, 
Y Kmáx Y pronostique la tasa de crecimiento para c =2 mg/L. 


c|os5 08 15 25 4 
E 24 53 76 89 


17.13 Un investigador ha reportado los datos que se tabulan en se- 
guida. Se sabe que dichos datos se pueden modelar por la siguiente 
ecuación: 


x= ¿0 
donde a y b son parámetros. Use una transformación para linealizar 


esta ecuación y luego utilice la regresión lineal para determinar a y 
b. Con base en su análisis, prediga y para x= 2.6: 


Al 
y | 05 2 29 35 4 


17.14 Se sabe que los datos que se tabulan en seguida se pueden 
modelar por la siguiente ecuación: 
a+ yxy? 
y=( D/x ) 
Use una transformación para linealizar esta ecuación y luego utilice 


la regresión lineal para determinar los parámetros a y b. Con base en 
su análisis, prediga y para x= 1.6. 


0:5. 1 2 3 4 
104 58 33 24 2 


XxX 


y 


17.15 Se proporcionan los siguientes datos: 


1 2 3 4 5 
22 28 36 45 55 


Xx 


y 
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Usted quiere usar regresión por mínimos cuadrados para ajustar estos 
datos con el siguiente modelo: 


y=a+bxr+£ 
x 


Determine los coeficientes estableciendo y resolviendo la ecuación 
(17.25). 
17.16 Dados los datos 


x | 5 10 15 20 25 30 35 40 45 50 
y | 17 24 31 33 37 37 40 40 42 41 


use regresión por mínimos cuadrados para ajustar a) una línea recta, 
b) una ecuación de potencias, c) una ecuación de tasa de crecimien- 
to de saturación, y d) una parábola. Grafique los datos junto con todas 
las curvas. ¿Alguna de las curvas es superior a las demás? Si así 
fuera, justifíquelo. 

17.17 Ajuste una ecuación cúbica a los datos siguientes: 


E A O A 
y [16 36 44 34 22 28 38 46 


Además de los coeficientes, determine 7? y Sy 
17.18 Utilice regresión lineal múltiple para ajustar 


Xx | 0 1 2 1 2 1 2 1 2 


y |15.1 179 12.7 25.6 20.55 35.1 29.7 454 40.2 


Calcule los coeficientes, el error estándar de la estimación y el co- 
eficiente de correlación. 
17.19 Use regresión lineal múltiple para ajustar 


e E A FARM E: 
AD AA A A A 
O E EE EE E - O” RS A 


Calcule los coeficientes, el error estándar de la estimación y el co- 
eficiente de correlación. 

17.20 Emplee regresión no lineal para ajustar una parábola a los 
datos siguientes: 


x 0.2 0.5 0.8 1.2 1.7 
y 500 700 1000 1200 2200 


2 2.3 
2650 3750 


17.21 Use regresión no lineal para ajustar una ecuación de tasa de 
crecimiento de saturación a los datos del problema 17.16. 

17.22 Vuelva a calcular los ajustes de regresión de los problemas a) 
17.3, y b) 17.17, con el enfoque matricial. Estime los errores estándar 
y desarrolle intervalos de confianza del 90% para los coeficientes. 
17.23 Desarrolle, depure y pruebe un programa en cualquier lengua- 
je de alto nivel o de macros que elija, para implantar el análisis de 
regresión lineal. Entre otras cosas: a) incluya comentarios para do- 
cumentar el código, y b) determine el error estándar y el coeficiente 
de determinación. 

17.24 Se hace la prueba a un material para estudiar la falla por fati- 
ga cíclica, en la que se aplica un esfuerzo, en MPa, al material y se 
mide el número de ciclos que se necesita para hacer que falle. Los 
resultados se presentan en la tabla siguiente. Al hacerse una gráfica 
log-log, del esfuerzo versus los ciclos, la tendencia de los datos 


presenta una relación lineal. Use regresión por mínimos cuadrados 
para determinar la ecuación de mejor ajuste para dichos datos. 


1000 10000 100000 
800 625 550 


1 000 000 
420 


N, ciclos | 1 10 100 


Esfuerzo, MPa|1 100 1000 925 


17.25 Los datos siguientes muestran la relación entre la viscosidad del 
aceite SAE 70 y su temperatura. Después de obtener el logaritmo de 
los datos, use regresión lineal para encontrar la ecuación de la recta 
que se ajuste mejor a los datos y al valor de r?, 


93.33 
0.085 


148.89 
0.012 


315.56 
0.00075 


Temperatura, *C | 26.67 
Viscosidad, , N - s/m? | 1.35 


17.26 Los datos siguientes representan el crecimiento bacterial en 
un cultivo líquido durante cierto número de días. 


Día 0 4 8 142 16 20 
Cantidad x 108 | 67 84 98 125 149 185 


Encuentre la ecuación de mejor ajuste a la tendencia de los datos. 
Pruebe varias posibilidades: lineal, parabólica y exponencial. Utilice 
el paquete de software de su elección para obtener la mejor ecuación 
para pronosticar la cantidad de bacterias después de 40 días. 

17.27 Después de una tormenta, se vigila la concentración de la 
bacteria E. coli en un área de natación: 


t (h) 
c(CFU/10O mL) 


a 8 12 16 20 24 
[1.600 1320 1000 890 650 560 


El tiempo se mide en horas transcurridas después de finalizar la 
tormenta, y la unidad CFU es una “unidad de formación de colonia”. 
Use los datos para estimar a) la concentración al final de la tormen- 
ta (1 = 0), y b) el tiempo en el que la concentración alcanzará 200 
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CFU/100 mL. Observe que la elección del modelo debe ser consis- 
tente con el hecho de que las concentraciones negativas son imposi- 
bles y de que la concentración de bacterias siempre disminuye con 
el tiempo. 

17.28 Un objeto se suspende en un túnel de viento y se mide la 
fuerza para varios niveles de velocidad del viento. A continuación 
están tabulados los resultados. 


v m/s | 10 20 30 40 50 60 70 80 
ÉN | 25 70 380 550 610 1220 830 1450 


Emplee regresión por mínimos cuadrados para ajustar estos datos con 
a) una línea recta, b) una ecuación de potencias basada en transforma- 
ciones logarítmicas, y c) un modelo de potencias con base en regresión 
no lineal. Muestre los resultados gráficamente. 

17.29 Ajuste un modelo de potencias a los datos del problema 17.28, 
pero emplee logaritmos naturales para hacer las transformaciones. 
17.30 Obtenga el ajuste por mínimos cuadrados del modelo siguiente: 


y=ax+ax+e 


Es decir, determine los coeficientes que generan el ajuste por mínimos 
cuadrados de un polinomio de segundo grado con intersección en el 
origen. Pruebe el enfoque con el ajuste de los datos del problema 
17.28. 

17.31 En el problema 17.11, en el que se usaron transformaciones 
para hacer lineal y ajustar el modelo siguiente: 


y =0,xeb0* 


emplee regresión no lineal para estimar d, y $, con base en los 
datos siguientes. Haga una gráfica del ajuste junto con los datos. 


x |01 02 04 06 09 13 15 17 18 


y [0.75 1.25 1.45 1.25 085 0.55 0.35 0.28 0.18 


Interpolación 


Con frecuencia se encontrará con que tiene que estimar valores intermedios entre puntos asociados 
con datos. El método más común que se usa para este propósito es la interpolación polinomial. Re- 
cuerde que la fórmula general para un polinomio de n-ésimo grado es 


0) =ay+ax+axt+--+a)x" (18.1) 


Dados n + 1 puntos asociados con datos, hay uno y sólo un polinomio de grado n que pasa a través 
de todos los puntos. Por ejemplo, hay sólo una línea recta (es decir, un polinomio de primer grado) 
que une dos puntos (figura 18.14). De manera similar, únicamente una parábola une un conjunto de 
tres puntos (figura 18.1b). La interpolación polinomial consiste en determinar el polinomio único 
de n-ésimo grado que se ajuste a n + 1 puntos asociados con datos. Este polinomio, entonces, pro- 
porciona una fórmula para calcular valores intermedios. 

Aunque hay uno y sólo un polinomio de n-ésimo grado que se ajusta a n + 1 puntos, existe una 
gran variedad de formas matemáticas en las cuales puede expresarse este polinomio. En este capí- 
tulo describiremos dos alternativas que son muy adecuadas para implementarse en computadora: los 
polinomios de Newton y de Lagrange. 


18.1 INTERPOLACIÓN POLINOMIAL DE NEWTON 
EN DIFERENCIAS DIVIDIDAS 


Como se dijo antes, existe una gran variedad de formas alternativas para expresar una interpolación 
polinomial. El polinomio de interpolación de Newton en diferencias divididas es una de las formas 
más populares y útiles. Antes de presentar la ecuación general, estudiaremos las versiones de pri- 
mero y segundo grados por su sencilla interpretación visual. 


18.1.1 Interpolación lineal 


La forma más simple de interpolación consiste en unir dos puntos asociados con datos con una línea 
recta. Dicha técnica, llamada interpolación lineal, se ilustra de manera gráfica en la figura 18.2. 
Utilizando triángulos semejantes, 


f 00) f(x.) ll f(x) $) 


Xx—Xo Xx, —Xo 


reordenándose se tiene 


Figura 18.1 

Ejemplos de interpolación polinomial: a) de 
primer grado (lineal) que une dos puntos, b) de 
segundo grado (cuadrática o parabólica) que 
une tres puntos y c) de tercer grado (cúbica) 
que une cuatro puntos. a) b) e) 
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1,09 = $) + ELE (1) (182) 


Xy 0 


que es una fórmula de interpolación lineal. La notación f(x) designa que 
éste es un polinomio de interpolación de primer grado. Observe que además 
de representar la pendiente de la línea que une los puntos, el término [f(x,) 
= fo)1/(, — xp) es una aproximación en diferencias divididas finitas a la 
primera derivada [ecuación (4.17)]. En general, cuanto menor sea el inter- 
valo entre los puntos asociados con datos, mejor será la aproximación. Esto 
se debe al hecho de que, conforme el intervalo disminuye, una función con- 
tinua estará mejor aproximada por una línea recta. Esta característica se de- 
muestra en el siguiente ejemplo. 


EJEMPLO 18.1 Interpolación lineal 


Planteamiento del problema Estime el logaritmo natural de 2 me- 
diante interpolación lineal. Primero, realice el cálculo por interpolación 
entre In 1 =0 y In 6 = 1.791759. Después, repita el procedimiento, pero use 
un intervalo menor de In 1 a In 4 (1.386294). Observe que el valor verdade- 
ro de In 2 es 0.6931472. 


Solución Usamos la ecuación (18.2) y una interpolación lineal para In(2) 
desde x, = 1 hasta x, = 6 para obtener 


f.Q)=0+ AS 2 (2 -1)=0.3583519 


0) 
Fx) 
F 1 (a) 4 
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sl 00,0, RR A 
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L ñ l a 
Xo0 x x E 
Figura 18.2 


Esquema gráfico de la interpolación lineal. Las 
áreas sombreadas indican los triángulos semejan- 
tes usados para obtener la fórmula de la interpo- 
lación lineal [ecuación(18.2)]. 


que representa un error: e, = 48.3%. Con el intervalo menor desde xy = 1 hasta x, = 4 se obtiene 


f,Q)=0+ EN ma (2-1)=0.4620981 


Así, usando el intervalo más corto el error relativo porcentual se reduce a e, = 33.3%. Ambas inter- 
polaciones se muestran en la figura 18.3, junto con la función verdadera. 


18.1.2 Interpolación cuadrática 


En el ejemplo 18.1 el error resulta de nuestra aproximación a una curva mediante una línea recta. En 
consecuencia, una estrategia para mejorar la estimación consiste en introducir alguna curvatura a la 
línea que une los puntos. Si se tienen tres puntos asociados con datos, éstos pueden ajustarse en un 
polinomio de segundo grado (también conocido como polinomio cuadrático o parábola). Una forma 


particularmente conveniente para ello es 


FJ) = by + dbi(x— xp) + balx — xp Mx — x1) 


(18.3) 


Observe que aunque la ecuación (18.3) parece diferir del polinomio general [ecuación (18.1)], las dos 
ecuaciones son equivalentes. Lo anterior se demuestra al multiplicar los términos de la ecuación 


(18.3): 

$00) =by+ dbix— bixp + bax? + baxyxy — baxo — box; 
o, agrupando términos, 

(0) =a,+ ajx+ ay? 


donde 
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Ay = by — bixy + baxo 


Fw 4 
ay =b; — baxy — bx; 
aL FG) =Inx a, =b, 
[E Así, las ecuaciones (18.1) y (18.3) son formas alternativas, 
— equivalentes del único polinomio de segundo grado que une 
1 los tres puntos. 
— Un procedimiento simple puede usarse para determinar 
qL o los valores de los coeficientes. Para encontrar b,, en la ecuación 
verdadero 0) E 
1 ; (18.3) se evalúa con x = xy para obtener 
E by =p) (18.4) 
[Es Estimaciones lineales 
_ La ecuación (18.4) se sustituye en la (18.3), después se evalúa 
| en x= x;, para tener 
Soma 5 x 
Xx 
y, = L00= $00) na 
Figura 18.3 4% 


Dos interpolaciones lineales para estimar In 2. Observe cómo 
el intervalo menor proporciona una mejor estimación. 


Por último, las ecuaciones (18.4) y (18.5) se sustituyen en la 
(18.3), después se evalúa en x = x, y (luego de algunas mani- 
pulaciones algebraicas) se resuelve para 


f0)- FC) _ FA) FG) 


p, =R=%A sa de (18.6) 


X, Xp 


Observe que, como en el caso de la interpolación lineal, b, todavía representa la pendiente de 
la línea que une los puntos xy y x¡. Así, los primeros dos términos de la ecuación (18.3) son equiva- 
lentes a la interpolación lineal de xp a x,, como se especificó antes en la ecuación (18.2). El último 
término, b(x — xpMx — x¡), determina la curvatura de segundo grado en la fórmula. 

Antes de ilustrar cómo utilizar la ecuación (18.3), debemos examinar la forma del coeficiente b,. 
Es muy similar a la aproximación en diferencias divididas finitas de la segunda derivada, que se pre- 
sentó antes en la ecuación (4.24). Así, la ecuación (18.3) comienza a manifestar una estructura seme- 
jante a la expansión de la serie de Taylor. Esta observación será objeto de una mayor exploración 
cuando relacionemos los polinomios de interpolación de Newton con la serie de Taylor en la sección 
18.1.4. Aunque, primero, mostraremos un ejemplo que indique cómo se utiliza la ecuación (18.3) para 
interpolar entre tres puntos. 


EJEMPLO 18.2 Interpolación cuadrática 


Planteamiento del problema Ajuste un polinomio de segundo grado a los tres puntos del 
ejemplo 18.1: 


X= Fo) =0 
x=4 fo) = 1.386294 
x=6 foc) =1.791759 


Con el polinomio evalúe In 2. 


Solución Aplicando la ecuación (18.4) se obtiene 
bo = 0 


La ecuación (18.5) da 
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1.386294 — 
y EDO 620981 10 
S 2L RES) = ln >= 
y con la ecuación (18.6) se obtiene [E 
1.791759—1.386294 0.4620981 — 
b, = SA = -0.0518731 E 
6-1 : Valor 
Sustituyendo estos valores en la ecuación (18.3) se obtiene la L oO b 
fórmula cuadrática E / y 
£(x) =0 + 0.4620981(x— 1) - 0.0518731(x— 1)(x — 4) L a 
1 / Estimación lineal 
que se evalúa en x = 2 para o Si ] ] ,s 
0 ¿7 


PQ) =0.5658444 


que representa un error relativo de e, = 18.4%. Así, la curvatura Figura 18.4 


determinada por la fórmula cuadrática (figura 18.4) mejora la El uso de la interpolación cuadrática para estimar In 2. Para 
interpolación comparándola con el resultado obtenido antes al usar COmparación se presenta también la interpolación lineal 


las líneas rectas del ejemplo 18.1 y en la figura 18.3. desde x= 1 hasta 4. 


¡_-——————_——— | 


18.1.3 Forma general de los polinomios de interpolación de Newton 


El análisis anterior puede generalizarse para ajustar un polinomio de n-ésimo grado an +1 puntos 
asociados con datos. El polinomio de n-ésimo grado es 


F. 00 =by+ bd (xXx) +++ 
A (187) 


Como se hizo antes con las interpolaciones lineales y cuadráticas, los puntos asociados con datos se 
utilizan para evaluar los coeficientes by, by,..., b,. Para un polinomio de n-ésimo grado se requieren 
n + 1 puntos asociados con datos: [xo, fo), [x1, fGc)),..., [X,,, Ax, )]. Usamos estos puntos asociados 
con datos y las siguientes ecuaciones para evaluar los coeficientes: 


bo =F (xo) (18.8) 
b¡ =f[x;, xo] (18.9) 
b,=f[x>, X1, Xo] (18.10) 
ba, =£ Lo. An" *, X1, Xo] (18.11) 


donde las evaluaciones de la función colocadas entre paréntesis son diferencias divididas finitas. Por 
ejemplo, la primera diferencia dividida finita en forma general se representa como 


FJI) 


X, =X; 


od (18.12) 


La segunda diferencia dividida finita, que representa la diferencia de las dos primeras diferencias 
divididas, se expresa en forma general como 


fx, x,]- flx,, x,] 


X, =X 


flx, xj, x,]= (18.13) 


En forma similar, la n-ésima diferencia dividida finita es 
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Harp AL Fl 1 229910. % 
O EA AE (18.14) 


X, 7% 


Estas diferencias sirven para evaluar los coeficientes en las ecuaciones (18.8) a (18.11), los cua- 
les se sustituirán en la ecuación (18.7) para obtener el polinomio de interpolación 


Fo) =f (o) + (<= xo) F[x1, xo] + (1 — xp Mx — 1) F[x2, X1, Xo] 


ds (a — xp)MA — 1): á (A Xp 1) f Lp, Aa Xol (18.15) 


que se conoce como polinomio de interpolación de Newton en diferencias divididas. Debe obser- 
varse que no se requiere que los puntos asociados con datos utilizados en la ecuación (18.15) estén 
igualmente espaciados o que los valores de la abscisa estén en orden ascendente, como se ilustra en 
el siguiente ejemplo. También, advierta cómo las ecuaciones (18.12) a (18.14) son recursivas, es decir, 
las diferencias de grado superior se calculan tomando diferencias de grado inferior (figura 18.5). Tal 
propiedad se aprovechará cuando desarrollemos un programa computacional eficiente en la sección 
18.1.5 para implementar el método. 


x 
z 


Primero Segundo Tercero 


fl, xo]. XX fo, 1, X0] 3H flX3, X2, X1, Xol 


flo, xa] —=3 100 X2, X1] ES 


fla, x2] 


WN —=O 
SSS 
RR 
ETE 


Figura 18.5 
Representación gráfica de la naturaleza recursiva de las diferencias divididas finitas. 


EJEMPLO 18.3 Polinomios de interpolación de Newton en diferencias divididas 


Planteamiento del problema En el ejemplo 18.2, los puntos asociados con datos xy = 1, x, =4 
y x,= 6 se utilizaron para estimar In 2 mediante una parábola. Ahora, agregando un cuarto punto 
[x3 = 5; f(c3) = 1.609438], estime |n 2 con un polinomio de interpolación de Newton de tercer grado. 


Solución Utilizando la ecuación (18.7), con n = 3, el polinomio de tercer grado es 
FC) = by + db (x— Xp) + DAX — xp MA — 1) + bl — xp) (A — x1H — 2) 


Las primeras diferencias divididas del problema son [ecuación (18.12)] 


1.386294 — 
O a 
4-0 
1.791759 — 1.386294 
flx,,x,]= 2 ze Sen e = 0.2027326 
6-4 
fl, ]= 1909438 —1:791759 _ 0 1873916 


5-6 
Las segundas diferencias divididas son [ecuación (18.13)] 


_ 0.2027326—0.4620981 _ 


F[X), Xi, Xg] nl 0.05187311 
1823216 —0.202732 
Floor] E — 002041100 


La tercera diferencia dividida es [ecuación (18.14) con n = 3] 
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fo4 
2 E, 
[_ FG) =Inx 
o Valor 
1 real 
E -— Estimación 
cúbica 
Figura 18.6 
F | Uso de la interpolación cúbica para 
o > e estimar In 2. 


-0.02041100 — (-0.05187311) 
5-1 


= 0.007865529 


fl[x3,x),X,, Xp] > 


Los resultados de f[x¡, xo], f[X2, X1, xo] y F[X3, X2, X1, Xp] representan los coeficientes b;, b, y bz de 
la ecuación (18.7), respectivamente. Junto con by = (xp) = 0.0, la ecuación (18.7) es 


60) =0 + 0.4620981(x-— 1) - 0.05187311(x — 1)(x — 4) + 0.007865529(x — 1)(x — 4x — 6) 


la cual sirve para evaluar 42) = 0.6287686, que representa un error relativo: e, = 9.3%. La gráfica 
del polinomio cúbico se muestra en la figura 18.6. 


18.1.4 Errores de la interpolación polinomial de Newton 


Observe que la estructura de la ecuación (18.15) es similar a la expansión de la serie de Taylor en el 
sentido de que se van agregando términos en forma secuencial, para mostrar el comportamiento de 
grado superior de la función. Estos términos son diferencias divididas finitas y, así, representan 
aproximaciones de las derivadas de grado superior. En consecuencia, como ocurrió con la serie de 
Taylor, si la función verdadera es un polinomio de n-ésimo grado, entonces el polinomio de interpo- 
lación de n-ésimo grado basado en n + 1 puntos asociados con datos dará resultados exactos. 

También, como en el caso de la serie de Taylor, es posible obtener una formulación para el error 
de truncamiento. De la ecuación (4.6) recuerde que el error de truncamiento en la serie de Taylor se 
expresa en forma general como 


po MO) n+1 
R.= ——— A A 4.6 
n (n + 1)! ( +1 Xx) ( ) 


donde É está en alguna parte del intervalo de x;, a x;,, ¡ Para un polinomio de interpolación de n-ésimo 
grado, una expresión análoga para el error es 


O 


"(+0 


(== 4) (=x%) (18.16) 


donde ¿ está en alguna parte del intervalo que contiene la incógnita y los datos. Para que esta fórmu- 
la sea útil, la función en turno debe ser conocida y diferenciable. Por lo común éste no es el caso. 
Por fortuna, hay una formulación alternativa que no requiere del conocimiento previo de la función. 
Utilizándose una diferencia dividida finita para aproximar la (n + 1)-ésima derivada, 


R, nn flx, Xp An lo +. .> Xo] (e — xp — xx)" pe (x — Xy) (18.17) 
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donde f[x, X,,, Xy» 13. - - , Xp] es la (n + 1)-ésima diferencia dividida finita. Debido a que la ecuación 
(18.17) contiene la incógnita f(x), no permite obtener el error. Sin embargo, si se tiene un punto 
asociado con un dato más, f(x, , ¡), la ecuación (18.17) puede usarse para estimar el error como sigue: 


Ro = Fs 1 Ao An 19 + + + > X0 JO — AR 1) +++ (Ax) (18.18) 


EJEMPLO 18.4 Estimación del error para el polinomio de Newton 


Planteamiento del problema Con la ecuación (18.18) estime el error en la interpolación poli- 
nomial de segundo grado del ejemplo 18.2. Use el punto asociado con un dato adicional f(x3) = f(5) 
= 1.609438 para obtener sus resultados. 


Solución Recuerde que en el ejemplo 18.2 el polinomio de interpolación de segundo grado pro- 
porcionó una estimación, £(2) = 0.5658444, que representa un error de 0.6931472 — 0.5658444 = 
0.1273028. Si no se hubiera conocido el valor verdadero, como usualmente sucede, la ecuación (18.18), 
junto con el valor adicional en x3, pudo haberse utilizado para estimar el error, 


R>= f[x%3, X2, X1, Xo](e — xp) — 1) — x2) 


R», = 0.007865529(x — 1)(x — 4)(x — 6) 


donde el valor de la diferencia dividida finita de tercer grado es como se calculó antes en el ejemplo 
18.3. Esta expresión se evalúa en x = 2 para obtener 


R, = 0.007863529(2 - 1)Q - 4/Q — 6) = 0.0629242 


que es del mismo grado de magnitud que el error verdadero. 


Con el ejemplo anterior y la ecuación (18.18), debe resultar claro que el error estimado para el 
polinomio de n-ésimo grado es equivalente a la diferencia entre las predicciones de grado (n + 1) y 
de grado n. Es decir, 


RSF 100) (0) (18.19) 


En otras palabras, el incremento que se agrega al caso de grado n para crear el caso de grado (n + 1) 
[es decir, la ecuación (18.18)] se interpreta como un estimado del error de grado n. Esto se percibe 
con claridad al reordenar la ecuación (18.19): 


Frios 160) = fa) + R, 


La validez de tal procedimiento se refuerza por el hecho de que la serie es altamente convergente. 
En tal situación, la predicción del grado (n + 1) debería ser mucho más cercana al valor verdadero 
que la predicción de grado n. En consecuencia, la ecuación (18.19) concuerda con nuestra definición 
estándar de error, al representar la diferencia entre la verdad y una aproximación. No obstante, ob- 
serve que mientras todos los otros errores estimados para los procedimientos iterativos presentados 
hasta ahora se encontraron como una predicción presente menos una previa, la ecuación (18.19) 
constituye una predicción futura menos una presente. Lo anterior significa que para una serie que 
es de convergencia rápida, el error estimado de la ecuación (18.19) podría ser menor que el error 
verdadero. Esto representaría una calidad muy poco atractiva si el error estimado fuera a emplearse 
como un criterio de terminación. Sin embargo, como se expondrá en la siguiente sección, los poli- 
nomios de interpolación de grado superior son muy sensibles a errores en los datos (es decir, están 
mal condicionados). Cuando se emplean para interpolación, a menudo dan predicciones que divergen 
en forma significativa del valor verdadero. Si se trata de detectar errores, la ecuación (18.19) es más 
sensible a tal divergencia. De esta manera, es más valiosa con la clase de análisis de datos explora- 
torios para los que el polinomio de Newton es el más adecuado. 


18.1 Interpolación polinomial de Newton en diferencias divididas 


18.1.5 Algoritmo computacional para el polinomio 


de interpolación de Newton LOCAL Fdd,,» 
DOFOR 71 = 0, n 
Tres propiedades hacen a los polinomios de interpolación de Newton Fdd; 0 = Y; 
muy atractivos para aplicaciones en computadora: END DO 
DOFOR j= 1, n 
1. Como en la ecuación (18.7), es posible desarrollar de manera DOFOR 1 =0,n- j 
secuencial versiones de grado superior con la adición de un Fddiyo= Cda jo 
solo término a la ecuación de grado inferior. Esto facilita la END DO 
evaluación de algunas versiones de diferente grado en el mis- END DO 
mo programa. En especial tal capacidad es valiosa cuando el xterm= 1 


yinto => Fddo o 
DOFOR order = 1, n 
xterm= xterm * (x1 


grado del polinomio no se conoce a priori. Al agregar nuevos 
términos en forma secuencial, podemos determinar cuándo se 
alcanza un punto de regreso disminuido (es decir, cuando la 
adición de términos de grado superior ya no mejora de mane- 
ra significativa la estimación, o en ciertas situaciones incluso la 
aleja). Las ecuaciones para estimar el error, que se analizan en 
el punto 3, resultan útiles para visualizar un criterio objetivo 
para identificar este punto de términos disminuidos. 

2. Las diferencias divididas finitas que constituyen los coeficien- 
tes del polinomio [ecuaciones (18.8) hasta (18.11)] se pueden 
calcular eficientemente. Es decir, como en la ecuación (18.14) 
y la figura 18.5, las diferencias de grado inferior sirven para 
calcular las diferencias de grado mayor. Utilizando esta infor- 
mación previamente determinada, los coeficientes se calculan 
de manera eficiente. El algoritmo en la figura 18.7 incluye un 
esquema así. 

3. El error estimado [ecuación (18.18)] se incorpora con facilidad en un algoritmo computacional 
debido a la manera secuencial en la cual se construye la predicción. 


Y Mtorder a yint2 
END order 
END Newtint 


Figura 18.7 


Todas las características anteriores pueden aprovecharse e incorporarse en un algoritmo general 
para implementar el polinomio de Newton (figura 18.7). Observe que el algoritmo consiste de dos 
partes: la primera determina los coeficientes a partir de la ecuación (18.7); la segunda establece las 
predicciones y sus errores correspondientes. La utilidad de dicho algoritmo se demuestra en el si- 
guiente ejemplo. 


EJEMPLO 18.5 Estimaciones del error para determinar el grado de interpolación 
adecuado 


Planteamiento del problema Después de incorporar el error [ecuación (18.18)], utilice el al- 
goritmo computacional que se muestra en la figura 18.7 y la información tabulada siguiente para 
evaluar f(x) =Inxenx=2: 


= 


Solución Los resultados de emplear el algoritmo de la figura 18.7 para > 
FO) = In x 


xo] 


1.2527630 


obtener una solución se muestran en la figura 18.8. El error estimado, 

junto con el error verdadero (basándose en el hecho de que In 2=0.6931472), 1 0 

se ilustran en la figura 18.9. Observe que el error estimado y el error ver- a a 
dadero son similares y que su concordancia mejora conforme aumenta el 5 16094379 
grado. A partir de estos resultados se concluye que la versión de quinto 3 1.0986123 
grado da una buena estimación y que los términos de grado superior no 1.5 0.4054641 
mejoran significativamente la predicción. a ee 


Este ejercicio también ilustra la importancia de la posición y el orden 
de los puntos. Por ejemplo, hasta la estimación de tercer grado, la mejoría 
es lenta debido a que los puntos que se agregaron (en x = 4, 6 y 5) están distantes y a un lado del 
punto de análisis en x=2. La estimación de cuarto grado muestra una mejoría un poco mayor, ya 


SUBROUTINE NewtInt (x, y, 


- Fdd; 5-1)/ Qi 


n, XT, yint, 


_ Xorder-1) 
yint2 > Y iMtorder-1 + FAdo, order 
Cdorder-1 = yint2 - Y Tntorder-1 


* xterm 


Un algoritmo para el polinomio de interpolación de 
Newton escrito en pseudocódigo. 
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NUMERO DE PUNTOS? 8 


Error 4 
X(0), y(0)=?1,0 
X( 1), y( 1) =?4,1.3862944 lA 
X(2), y( 2) = ? 6,1.7917595 ' 
X( 3), y( 3) = ? 5,1.6094379 
X( 4), y( 4) = 2? 3,1.0986123 
X( 5), y( 5) =?1.5,0.40546411 
X( 6), y( 6) = ? 2.5,0.91629073 
X(7), y( 7) =2?3.5,1.2527630 
INTERPOLACION EN X = 2 
GRADO  F(X) ERROR 
0 0.000000 0.462098 
1 0.462098 0.103746 
2 0.565844 0.062924 Error estimado (invertido) 
3 0.628769 0.046953 
4 0.675722 0.021792 
5 0.697514 -0.003616 
6 0.693898 -0.000459 E 
7 0.693439 : 
Figura 18.8 Figura 18.9 
Resultados de un programa, basado en Errores relativos porcentuales para la predicción 
el algoritmo de la figura 18.7, para evaluar de In 2 como función del grado del polinomio de 
In 2. interpolación. 


que el nuevo punto en x = 3 está más cerca de la incógnita. Aunque, la disminución más dramática 
en el error corresponde a la inclusión del término de quinto grado usando el punto asociado con un 
dato en x = 1.5. Dicho punto está cerca de la incógnita y también se halla al lado opuesto de la ma- 
yoría de los otros puntos. En consecuencia, el error se reduce a casi un grado de magnitud. 

La importancia de la posición y el orden de los datos también se demuestra al usar los mismos 
datos para obtener una estimación para ln 2, pero considerando los puntos en un orden diferente. La 
figura 18.9 muestra los resultados en el caso de invertir el orden de los datos originales; es decir, xp 
= 3.5, x, = 2.5, x3 = 1.5, y así sucesivamente. Como los puntos iniciales en este caso se hallan más 
cercanos y espaciados a ambos lados de In 2, el error disminuye mucho más rápidamente que en la 
situación original. En el término de segundo grado, el error se redujo a menos de e,=2%. Se podrían 
emplear otras combinaciones para obtener diferentes velocidades de convergencia. 


El ejemplo anterior ilustra la importancia de la selección de los puntos. Como es intuitivamen- 
te lógico, los puntos deberían estar centrados alrededor, y tan cerca como sea posible, de las incóg- 
nitas. Esta observación también se sustenta por un análisis directo de la ecuación para estimar el 
error [ecuación (18.17)]. Si suponemos que las diferencias divididas finitas no varían mucho a través 
de los datos, el error es proporcional al producto: (x— xXx —x1) --- (x—x,). Obviamente, cuanto más 
cercanos a x estén los puntos, menor será la magnitud de este producto. 


18.2 POLINOMIOS DE INTERPOLACIÓN DE LAGRANGE 


El polinomio de interpolación de Lagrange es simplemente una reformulación del polinomio de 
Newton que evita el cálculo de las diferencias divididas, y se representa de manera concisa como 


f,00)= AE) (18.20) 
i=0 
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donde 
L,(x 18.21 
(m= Ino E (1821) 
donde II designa el “producto de”. Por ejemplo, la versión lineal (n = 1) es 
XxX x—X 
f 1)= —F (9) + EF) (18.22) 
Xy = Xy Xx, = Xy 
y la versión de segundo grado es 
x—x Mx —x XxX Mx —x 
0) ( yl 2) FA sl JM 2) Fo ,) 
(x= Xx (Xx, —X,) ea — Xxx, — xp) 
(x—x,Mx —x,) 
0 1 f(x,) (18.23) 
(x, — XxX, —x,) 
La ecuación (18.20) se obtiene de manera directa del polinomio de 
Newton (cuadro 18.1). Sin embargo, el razonamiento detrás de la formu- den ¡¡ 
lación de Lagrange se comprende directamente al darse cuenta de que Tercer término 


cada término £;(x) será 1 en x= x, y O en todos los otros puntos (figura 
18.10). De esta forma, cada producto L£;(x) f(x;) toma el valor de f(x;) en 
el punto x,. En consecuencia, la sumatoria de todos los productos en la 
ecuación (18.20) es el único polinomio de n-ésimo grado que pasa exac- 
tamente a través de todos los n + 1 puntos asociados con datos. 50 


Sumatoria 
de los tres 
términos = f(x) 


100 


Primer término 


EJEMPLO 18.6 Polinomios de interpolación de Lagrange 0 
30 

Planteamiento del problema Con un polinomio de interpolación 
de Lagrange de primero y segundo grado evalúe In 2 basándose en los -50 
datos del ejemplo 18.2: 

Xo=1 Fay =0 o Segundo término 

x=4 Kx¡) = 1.386294 

x=6 Kx>2) = 1.791760 


-150 
Solución El polinomio de primer grado [ecuación (18.22)] se utiliza 


para obtener la estimación en x = 2, Figura 18.10 
2-4 4, 2- Descripción visual del razonamiento detrás del poli- 
f Q)= 0+ 1 -386294 = 0.4620981 nomio de Lagrange. Esta figura muestra un caso de 


segundo grado. Cada uno de los tres términos en la 
ecuación (18.23) pasa a través de uno de los pun- 
tos asociados con datos y es cero en los otros dos. 
La suma de los tres términos, por lo tanto, debe ser 
e e _ _ el único polinomio de segundo grado f(x) que pasa 
PSALSS) 0+ P=)2=6) 1.386294 exactamente a través de los tres puntos. 
(1-4(1-6) (4 -1)(4- 6) 

(2-DQ-4) 

(6-1)(6 — 4) 


De manera similar, el polinomio de segundo grado se desarrolla así: 
[ecuación (18.23)] 


f,2) == 


1.791760 = 0.5658444 


Como se esperaba, ambos resultados concuerdan con los que se obtuvieron antes al usar el polinomio 
de interpolación de Newton. 
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Observe que, como en el método de Newton, la forma de Lagrange tiene un error estimado de 
[ecuación (18.17)] 


n 
n — E A A A] MES a X;) 
i=0 


De este modo, si se tiene un punto adicional en x= x,, , ¡, se puede obtener un error estimado. Sin 
embargo, como no se emplean las diferencias divididas finitas como parte del algoritmo de Lagran- 
ge, esto se hace rara vez. 

Las ecuaciones (18.20) y (18.21) se programan de manera muy simple para implementarse en 
una computadora. La figura 18.11 muestra el pseudocódigo que sirve para tal propósito. 

En resumen, en los casos donde se desconoce el grado del polinomio, el método de Newton 
tiene ventajas debido a la comprensión que proporciona respecto al comportamiento de las fórmu- 
las de diferente grado. Además, el estimado del error representado por la ecuación (18.18) se agre- 
ga usualmente en el cálculo del polinomio de Newton debido a que el estimado emplea una 
diferencia finita (ejemplo 18.5). De esta manera, para cálculos exploratorios, a menudo se prefiere 
el método de Newton. 


Cuadro 18.1 Obtención del polinomio de lagrange directamente a partir del polinomio 


de interpolación de Newton 


El polinomio de interpolación de Lagrange se obtiene de manera 
directa a partir de la formulación del polinomio de Newton. Haremos 
esto únicamente en el caso del polinomio de primer grado [ecuación 
(18.2)]. Para obtener la forma de Lagrange, reformulamos las dife- 
rencias divididas. Por ejemplo, la primera diferencia dividida, 


FG) fo) 


X, = Xy 


Fx, x ]= (C18.1.1) 


se reformula como 


flo, ]= L4D. y 40) (C18.1.2) 


X, = Xy Xy = A, 


conocida como la forma simétrica. Al sustituir la ecuación (C18.1.2) 
en la (18.2) se obtiene 


X=X, 


fx) + Á= 
Xo 


£0)=f)+ 


1 Xx > 


1%) 
0 X; 


Por último, al agrupar términos semejantes y simplificar se obtiene 
la forma del polinomio de Lagrange, 


XX, =% 


£0)= faja E Ax) 
X= X, = Xp 


Figura 18.11 


Pseudocódigo para la interpolación de 
Lagrange. Este algoritmo se establece 


para calcular una sola predicción de 


FUNCTION Lagrng(lx, Y, Nn, XX) 
sum = 0 
DOFOR ¡ = 0, n 
product 
DOFOR j= 0, n 
IF 14H j THEN 


1 
$ 


product = product*(xx -= X¿)/(x; = Xj) 
ENDIF 
END DO 
sum = sum + product 


END DO 


grado n-ésimo, donde n + 1 es el nú- 
mero de puntos asociados con datos. Lagrng = sum 


END Lagrng 


Cuando se va a ejecutar sólo una interpolación, las formulaciones de Lagrange y de Newton 
requieren un trabajo computacional semejante. No obstante, la versión de Lagrange es un poco más 
fácil de programar. Debido a que no requiere del cálculo ni del almacenaje de diferencias divididas, 
la forma de Lagrange a menudo se utiliza cuando el grado del polinomio se conoce a priori. 


18.3 Coeficientes de un polinomio de interpolación 


EJEMPLO 18.7 Interpolación de Lagrange empleando la computadora 


Planteamiento del problema Es posible usar el algoritmo de la figura 18.11 para estudiar un 
problema de análisis de tendencia que se relaciona con nuestro conocido caso de la caída del para- 
caidista. Suponga que se tiene un instrumento para medir la 
velocidad del paracaidista. Los datos obtenidos en una prueba 
particular se encuentran en la tabla de la derecha. Tiempo, Velocidad medida v, 


Nuestro problema consiste en estimar la velocidad del ? Eme 
paracaidista en t = 10 s para tener las mediciones faltantes 1 800 
entre t =7 y t= 13 s. Estamos conscientes de que el compor- 3 2310 
tamiento de los polinomios de interpolación tal vez resulte . E 
inesperado. Por lo tanto, construiremos polinomios de grados 13 4755 


4,3,2 y 1, y compararemos los resultados. 


Solución El algoritmo de Lagrange se utiliza para construir polinomios de interpolación de cuar- 
to, tercer, segundo y primer grados. 

El polinomio de cuarto grado y los datos de entrada se grafican como se muestra en la figura 
18.12a. Es evidente, al observar la gráfica, que el valor estimado de y en x = 10 es mayor que la 
tendencia global de los datos. 

Las figuras 18.12b a 18.12d muestran las gráficas de los resultados de los cálculos con las inter- 
polaciones de los polinomios de tercer, segundo y primer grados, respectivamente. Se observa que 
cuanto más bajo sea el grado, menor será el valor estimado de la velocidad en £= 10 s. Las gráficas 
de los polinomios de interpolación indican que los polinomios de grado superior tienden a sobrepa- 
sar la tendencia de los datos, lo cual sugiere que las versiones de primer o segundo grado son las más 
adecuadas para este análisis de tendencia en particular. No obstante, debe recordarse que debido a 
que tratamos con datos inciertos, la regresión, de hecho, será la más adecuada. 


¿ 6000 - Y 6000 — >» 

= E [a 

o —= ES 

= 3000 - 3000 - 
AAA A AA AAA AA 
0 5 10 15 0 5 10 15 

2 5000 c) 6000 — Figura 18.12 

e [a A Gráficas que muestran 

E Esa de a interpolaciones de a) 
O AA y ap) Cuarto grado, b) tercer 
0 5 10 15 0 5 10 15  9Yrado, c) segundo grado 

1(s) 1(5) y d) primer grado. 


El ejemplo anterior ilustró que los polinomios de grado superior tienden a estar mal condicio- 
nados; es decir, tienden a ser altamente susceptibles a los errores de redondeo. El mismo problema 
se presenta en la regresión con polinomios de grado superior. La aritmética de doble precisión ayu- 
da algunas veces a disminuir el problema. Sin embargo, conforme el grado aumente, habrá un 
punto donde el error de redondeo interferirá con la habilidad para interpolar usando los procedi- 
mientos simples estudiados hasta ahora. 


18.3 COEFICIENTES DE UN POLINOMIO DE INTERPOLACIÓN 


Aunque el polinomio de Newton y el de Lagrange son adecuados para determinar valores intermedios 
entre puntos, no ofrecen un polinomio adecuado de la forma convencional 


0) =ay+ax+axt+--+a),x" (18.24) 
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Un método directo para calcular los coeficientes de este polinomio se basa en el hecho de que 
se requieren n + 1 puntos asociados con datos para determinar los n + 1 coeficientes. Así, se utiliza 
un sistema de ecuaciones algebraicas lineales simultáneas para calcular las a,. Por ejemplo, suponga 
que usted desea calcular los coeficientes de la parábola 


$0) = a, + ax + ay? (18.25) 


Se requiere de tres puntos: [xo, fo), [x1, f1)] y Lc2, f(c2)]. Cada uno se sustituye en la ecuación 
(18.25): 


Ko) = Ay + a1Xp + 42% 
Ax) = a+ a1x1 + a7xj (18.26) 


Ax) = 4) + 41x) + 49% 


De esta manera, las x son los puntos conocidos, y las a, las incógnitas. Como hay el mismo número 
de ecuaciones que de incógnitas, la ecuación (18.26) se podría resolver con uno de los métodos de 
eliminación de la parte tres. 

Debe observarse que el procedimiento anterior no es el método de interpolación más eficiente 
para determinar los coeficientes de un polinomio. Press ef al. (1992) ofrecen un análisis y códigos para 
computadora de los procedimientos más eficientes. Cualquiera que sea la técnica empleada, se debe 
hacer una advertencia. Sistemas como los de la ecuación (18.26) están notoriamente mal condicio- 
nados. Ya sea que se resuelvan con un método de eliminación o con un algoritmo más eficiente, los 
coeficientes resultantes pueden ser bastante inexactos, en particular para n grandes. Si se usan para 
una interpolación subsecuente, a menudo dan resultados erróneos. 

En resumen, si usted se interesa en determinar un punto intermedio, emplee la interpolación de 
Newton o de Lagrange. Si tiene que determinar una ecuación de la forma de la (18.24), limítese a 
polinomios de grado menor y verifique cuidadosamente sus resultados. 


18.4 INTERPOLACIÓN INVERSA 


Como la nomenclatura implica, los valores de f(x) y x en la mayoría de los problemas de interpolación 
son las variables dependiente e independiente, respectivamente. En consecuencia, los valores de las 
x con frecuencia están espaciados uniformemente. Un ejemplo simple es una tabla de valores obte- 
nida para la función f(x) = 1/x, 


Xx | 1 2 3 4 5 6 7 


FX | 1 0.5 0.3333 0.25 0.2 0.1667 0.1429 


Ahora suponga que usted debe usar los mismos datos, pero que se le ha dado un valor de f(x) y 
debe determinar el valor correspondiente de x. Por ejemplo, para los datos anteriores, suponga que 
se le pide determinar el valor de x que corresponda a f(x) = 0.3. En tal caso, como se tiene la función 
y es fácil de manipular, la respuesta correcta se determina directamente, x = 1/0.3 = 3.3333. 

A ese problema se le conoce como interpolación inversa. En un caso más complicado, usted 
puede sentirse tentado a intercambiar los valores f(x) y x [es decir, tan sólo graficar x contra f(0)] y 
usar un procedimiento como la interpolación de Lagrange para determinar el resultado. Por desgra- 
cia, cuando usted invierte las variables no hay garantía de que los valores junto con la nueva abscisa 
[las f(c)] estén espaciados de una manera uniforme. Es más, en muchos casos, los valores estarán 
“condensados”. Es decir, tendrán la apariencia de una escala logarítmica, con algunos puntos adya- 
centes muy amontonados y otros muy dispersos. Por ejemplo, para f(x) = 1/x el resultado es 


fx) | 0.1429 0.1667 0.2 0.25 0.3333 0.5 1 


Xx | 7 6 5 4 3 2 1 


Tal espaciamiento no uniforme en las abscisas a menudo lleva a oscilaciones en el resultado del 
polinomio de interpolación. Esto puede ocurrir aun para polinomios de grado inferior. 


18.5 Comentarios adicionales 


Una estrategia alterna es ajustar un polinomio de interpolación de grado n-ésimo, f(x), a los 
datos originales [es decir, con f(x) contra x]. En la mayoría de los casos, como las x están espaciadas 
de manera uniforme, este polinomio no estará mal condicionado. La respuesta a su problema, enton- 
ces, consiste en encontrar el valor de x que haga este polinomio igual al dado por f(x). Así, ¡el pro- 
blema de interpolación se reduce a un problema de raíces! 

Por ejemplo, para el problema antes descrito, un procedimiento simple sería ajustar los tres 
puntos a un polinomio cuadrático: (2, 0.5), (3, 0.3333) y (4, 0.25), cuyo resultado será 


P.00) =1.08333 — 0.375x + 0.041667x? 


La respuesta al problema de interpolación inversa para determinar la x correspondiente a f(x) = 0.3 
será equivalente a la determinación de las raíces de 


0.3 = 1.08333 — 0.375x + 0.041667x? 


En este caso simple, la fórmula cuadrática se utiliza para calcular 


a 0.375 + 0.375) — 4(0.041667)0.78333 _ 5.704158 
2(0.041667) 3.295842 


Así, la segunda raíz, 3.296, es una buena aproximación al valor verdadero: 3.333. Si se desea una 
exactitud adicional, entonces podría emplear un polinomio de tercero o cuarto grados junto con 
uno de los métodos para la localización de raíces analizado en la parte dos. 


18.5 COMENTARIOS ADICIONALES 


Antes de proceder con la siguiente sección, se deben mencionar dos temas adicionales: la interpo- 
lación y extrapolación con datos igualmente espaciados. 

Como ambos polinomios, el de Newton y el de Lagrange, son compatibles con datos espaciados 
en forma arbitraria, usted se preguntará por qué nos ocupamos del caso especial de datos igualmente 
espaciados (cuadro 18.2). Antes de la llegada de las computadoras digitales, dichas técnicas tenían gran 
utilidad para interpolación a partir de tablas con datos igualmente espaciados. De hecho, se desarrolló 
una estructura computacional, conocida como tabla de diferencias divididas, para facilitar la imple- 
mentación de dichas técnicas. (La figura 18.5 es un ejemplo de esa tabla.) 

Sin embargo, como las fórmulas dadas son subconjuntos de los 
esquemas de Newton y Lagrange compatibles con una computadora y 
debido a las muchas funciones tabulares existentes, como subrutinas de FO 4 
bibliotecas, ha disminuido la necesidad de tener versiones para datos E Interpolación 
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¡Extrapolación 
>| + 


igual mente espaciados. A pesar de ello, las hemos incluido en este tema 
por su relevancia en las últimas partes de este libro. En especial, son 
necesarias para obtener fórmulas de integración numérica que por lo 
común utilizan datos igualmente espaciados (capítulo 21). Como las 
fórmulas de integración numérica son importantes en la solución de 
ecuaciones diferenciales ordinarias, el análisis del cuadro 18.2 adquie- 
re también significado para la parte siete. 

Extrapolación es el proceso de estimar un valor de f(x) que se 
encuentra fuera del dominio de los valores conocidos, Xq, Xy»..., X,, (f1- 
gura 18.13). En una sección anterior, mencionamos que la interpolación 
más exacta se obtiene cuando las incógnitas están cerca de los puntos. | 
En efecto, éste no es el caso cuando la incógnita se encuentra fuera del | 


Curva 
real 


y 
1 
", Extrapolación 
E del polinomio 
¡ de interpolación 


intervalo y, en consecuencia, el error en la extrapolación puede ser muy 
grande. Como se ilustra en la figura 18.13, la naturaleza de la extrapo- 
lación de extremos abiertos representa un paso a lo desconocido, ya que 
el proceso extiende la curva más allá de la región conocida. Como tal, 
la curva real podrá fácilmente diverger de la predicción. Por lo tanto, 
se debe tener mucho cuidado cuando aparezca un problema donde se 
deba extrapolar. 


*o Xx 


Figura 18.13 


29) 


Ilustración de la posible divergencia de una predic- 
ción extrapolada. La extrapolación se basa en ajustar 
una parábola con los primeros tres puntos conocidos. 
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Cuadro 18.2 


Interpolación con datos igualmente espaciados 


Si los datos están igualmente espaciados y en orden ascendente, 
entonces la variable independiente tiene los valores de 


x1=x+h 
X, = Xp + 2h 
Xy = Xy + nh 


donde h es el intervalo, o tamaño de paso, entre los datos. Basándo- 
se en esto, las diferencias divididas finitas se pueden expresar en 
forma concisa. Por ejemplo, la segunda diferencia dividida hacia 
adelante es 


Fx) -$f(x,) F(x,)-f(x0) 


X= Xx, =%0 


fx, x,,x,]= 


que se expresa como 


FA)-2f(x,)+f(x,) 


C18.2.1 
am ( ) 


fx, x,,x,]= 


ya que X, — Xy = Xx, —X, = (%, — Xp)/2 = h. Ahora recuerde que la segun- 
da diferencia hacia adelante es igual a [numerador de la ecuación (4.24)] 


AP) = fr) — 241) + [G0) 


Por lo tanto, la ecuación (C18.2.1) se representa como 


A f(x) 
,X,,X,]= > 
ACA ETT 
o, en general 
stas] 700 (C18.2.2) 
nh" 


Usando la ecuación (C18.2,2), en el caso de datos igualmente espa- 
ciados, expresamos el polinomio de interpolación de Newton [ecua- 
ción (18.15)] como 


E 
.(00)=F(x,)+ a %,) 
Nx) 
je (x—x,Mx—x, —h) 
¿2 xx, =h) 
nh" 


xx, -(n-Dh]+R, (C18.2.3) 


donde el residuo es el mismo que en la ecuación (18.16). Esta ecua- 
ción se conoce como fórmula de Newton o la fórmula hacia adelan- 
te de Newton-Gregory, que se puede simplificar más al definir una 
nueva cantidad, «: 


X—Xo 
ho 
Esta definición se utiliza para desarrollar las siguientes expresiones 
simplificadas de los términos en la ecuación (C18.2.3): 
x—-X= 0h 
h= 0h 


X—Xo h=ha0-1) 


x-x-(n-Dh=0h-(n- Dh=h0-n+ 1) 


que se sustituye en la ecuación (C18.2.3) para tener 


£,(0=$(x,)+Af(x,J0+ LLO arar 1) 
LL a D) + (a-n+DER, 
n 
(C18.2.4) 
donde 
(n+1) 
sd O, "oo D(a-2) + (0=n) 


"(+0 


En el capítulo 21 esta notación concisa tendrá utilidad en la deducción 
y análisis del error de las fórmulas de integración. 

Además de la fórmula hacia adelante, también existen las fórmu- 
las hacia atrás y central de Newton-Gregory. Para más información 
respecto de la interpolación para datos igualmente espaciados véase 
Carnahan, Luther y Wilkes (1969). 


18.6 


INTERPOLACIÓN MEDIANTE TRAZADORES (SPLINES) 


En las secciones anteriores se usaron polinomios de n-ésimo grado para interpolar entre n + 1 pun- 
tos asociados con datos. Por ejemplo, para ocho puntos se puede obtener un perfecto polinomio de 
séptimo grado. Esta curva podría agrupar todas las curvas (al menos hasta, e incluso, la séptima 
derivada) sugeridas por los puntos. No obstante, hay casos donde estas funciones llevarían a resul- 
tados erróneos a causa de los errores de redondeo y los puntos lejanos. Un procedimiento alternati- 
vo consiste en colocar polinomios de grado inferior en subconjuntos de los puntos asociados con 
datos. Tales polinomios conectores se denominan trazadores o splines. 


18.6 


Por ejemplo, las curvas de tercer grado empleadas para unir cada par de 
puntos asociados con datos se llaman trazadores cúbicos. Esas funciones se pue- 
den construir de tal forma que las conexiones entre ecuaciones cúbicas adyacen- 
tes resulten visualmente suaves. Podría parecer que la aproximación de tercer 
grado de los trazadores sería inferior a la expresión de séptimo grado. Usted se 
preguntaría por qué un trazador aún resulta preferible. 

La figura 18.14 ilustra una situación donde un trazador se comporta mejor que 
un polinomio de grado superior. Éste es el caso donde una función en general es 
suave, pero presenta un cambio abrupto en algún lugar de la región de interés. El 
tamaño de paso representado en la figura 18.14 es un ejemplo extremo de tal cam- 
bio y sirve para ilustrar esta idea. 

La figura 18.14a a c ilustra cómo un polinomio de grado superior tiende a 
formar una curva de oscilaciones bruscas en la vecindad de un cambio súbito. En 
contraste, el trazador también une los puntos; pero como está limitado a cambios 
de tercer grado, las oscilaciones son mínimas. De esta manera, el trazador usual- 
mente proporciona una mejor aproximación al comportamiento de las funciones 
que tienen cambios locales y abruptos. 

El concepto de trazador se originó en la técnica de dibujo que usa una cinta 
delgada y flexible (llamada spline, en inglés), para dibujar curvas suaves a través de 
un conjunto de puntos. El proceso se representa en la figura 18.15 para una serie 
de cinco alfileres (puntos asociados con datos). En esta técnica, el dibujante colo- 
ca un papel sobre una mesa de madera y coloca alfileres o clavos en el papel (y la 
mesa) en la ubicación de los puntos asociados con datos. Una curva cúbica suave 
resulta al entrelazar la cinta entre los alfileres. De aquí que se haya adoptado el 
nombre de “trazador cúbico” (en inglés: “cubic spline”) para los polinomios de este 
tipo. 

En esta sección se usarán primero funciones lineales simples para presentar 
algunos conceptos y problemas básicos relacionados con la interpolación median- 
te splines. A continuación obtendremos un algoritmo para el ajuste de trazadores 
cuadráticos a los datos. Por último, presentamos material sobre el trazador cúbico, 
que es la versión más común y útil en la práctica de la ingeniería. 


18.6.1 Trazadores lineales 


La unión más simple entre dos puntos es una línea recta. Los trazadores de primer 
grado para un grupo de puntos asociados con datos ordenados pueden definirse como 
un conjunto de funciones lineales, 
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Fx) | — 
0 Y 


a) 


b > 
Xx 


0 
b) 


fo) 
| / SS, Y 
c) 


F(x) | 


0 x 
d) 


Figura 18.14 

Una representación visual de una situación 
en la que los trazadores son mejores que 
los polinomios de interpolación de grado 
superior. La función que se ajusta presenta 
un incremento súbito en x=0. Los incisos 
a) ac) indican que el cambio abrupto indu- 
ce oscilaciones en los polinomios de inter- 
polación. En contraste, como se limitan 

a Curvas de tercer grado con transiciones 
suaves, un trazador lineal ad) ofrece una 
aproximación mucho más aceptable. 


Figura 18.15 

La técnica de dibujo que usa una cinta 
delgada y flexible para dibujar curvas 
suaves a través de una serie de puntos. 
Observe cómo en los puntos extremos, el 
trazador tiende a volverse recto. Esto se 
conoce como un trazador “natural”. 
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JO) = fo) + Max — Xp) XXXIX] 
JO) =fx1) + m¡(x—x) Xx <XX<X) 


109) = JC, 1) + My (4 Xp 1) Xp -1 XX S Xy, 
donde m, es la pendiente de la línea recta que une los puntos: 


Y F%;.1) > F(x,) 
m = === —T 


i 


(18.27) 
Arg A; 

Estas ecuaciones se pueden usar para evaluar la función en cualquier punto entre xp y x, locali- 
zando primero el intervalo dentro del cual está el punto. Después se usa la ecuación adecuada para 
determinar el valor de la función dentro del intervalo. El método es obviamente idéntico al de la 
interpolación lineal. 


EJEMPLO 18.8  Trazadores de primer grado Tabla 18.1 


Datos para ajustarse 
Planteamiento del problema Ajuste los datos de la tabla 18.1 con con trazadores. 


trazadores de primer grado. Evalúe la función en x = 5. 


x f(x) | 


Solución Se utilizan los datos para determinar las pendientes entre 3.0 2.5 
los puntos. Por ejemplo, en el intervalo de x= 4.5 ax="7 la pendiente se aa E 
calcula con la ecuación (18.27): en ne 
m=29=1 0.60 
7-4.5 


Se calculan las pendientes en los otros intervalos y los trazadores de primer grado obtenidos se 
grafican en la figura 18.16a. El valoren x=5 es 1.3. 


Una inspección visual a la figura 18.164 indica que la principal desventaja de los trazadores de 
primer grado es que no son suaves. En esencia, en los puntos asociados con datos donde se encuen- 
tran dos trazadores (llamado nodo), la pendiente cambia de forma abrupta. Formalmente, la primer 
derivada de la función es discontinua en esos puntos. Esta deficiencia se resuelve usando trazadores 
polinomiales de grado superior, que aseguren suavidad en los nodos al igualar las derivadas en esos 
puntos, como se analiza en la siguiente sección. 


18.6.2 Trazadores (splines) cuadráticos 


Para asegurar que las derivadas m-ésimas sean continuas en los nodos, se debe emplear un trazador 
de un grado de, al menos, m + 1. En la práctica se usan con más frecuencia polinomios de tercer 
grado o trazadores cúbicos que aseguran primera y segunda derivadas continuas. Aunque las deri- 
vadas de tercer grado y mayores podrían ser discontinuas cuando se usan trazadores cúbicos, por lo 
común no pueden detectarse en forma visual y, en consecuencia, se ignoran. 

Debido a que la deducción de trazadores cúbicos es algo complicada, la hemos incluido en una 
sección subsecuente. Decidimos ilustrar primero el concepto de interpolación mediante trazadores 
usando polinomios de segundo grado. Esos ““trazadores cuadráticos” tienen primeras derivadas con- 
tinuas en los nodos. Aunque los trazadores cuadráticos no aseguran segundas derivadas iguales en 
los nodos, sirven muy bien para demostrar el procedimiento general en el desarrollo de trazadores de 
grado superior. 
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El objetivo de los trazadores cuadráticos es obtener un polinomio £0d 4 
de segundo grado para cada intervalo entre los puntos asociados con [A Temaderd 
datos. De manera general, el polinomio en cada intervalo se represen- primer orden 
ta como 24 
f00)=aj xt +bix+c; (18.28) [= 
La figura 18.17 servirá para aclarar la notación. Para n + 1 puntos 0 LL] pS 
asociados con datos (1 =0, 1, 2, ..., n) existen n intervalos y, en conse- 2 4 6 8 10 Y 
cuencia, 3n constantes desconocidas (las a, b y c) por evaluar. Por lo a) 
tanto, se requieren 3n ecuaciones o condiciones para evaluar las in- 
cógnitas. Estas son: 0D 4 
0 . . = Trazador de 
1. Los valores de la función de polinomios adyacentes deben ser segundo orden 
iguales en los nodos interiores. Esta condición se representa como 2 
aX 51 + Dj 1x1 + Ci 1 = Ai 1) (18.29) FP 
ax + Dx + C= $001) (18.30) 0 - 
para ¡=2 a n. Como sólo se emplean nodos interiores, las ecua- b) 
ciones (18.29) y (18.30) proporcionan, cada una, n— 1 condicio- 
nes; en total, 2n — 2 condiciones. 109 4 
2. La primera y la última función deben pasar a través de los puntos E Trazador 
extremos. Esto agrega dos ecuaciones más: pUBIEa Interpolación 
2L cúbica 
41X% + dix + Cc, =p) (18.31) 
Ar + Dx + Cn =p) (18.32) 
0 a 
en total tenemos 2n — 2 + 2 = 2n condiciones. x 
3. Las primeras derivadas en los nodos interiores deben ser iguales. c) 
La primera derivada de la ecuación (18.28) es 
F (o) =2ax + b Figura 18.16 
o Ajuste mediante trazadores de un conjunto de cuatro 
Por lo tanto, de manera general la condición se representa como puntos. a) Trazador lineal, b) trazador cuadrático y c) 
Tai abs Dago eb; (18.33) trazador cúbico; se grafica también un polinomio de 
interpolación cúbico. 
para ¿=2 an. Esto proporciona otras n— 1 condiciones, llegando 
a un total de 2n +n-—1=3n- 1. Como se tienen 3n incógnitas, 
nos falta una condición más. A menos que tengamos alguna in- 
formación adicional respecto de las funciones o sus derivadas, tenemos que realizar una elección 
arbitraria para calcular las constantes. Aunque hay varias opciones, elegimos la siguiente: 
Fw 4 


2 
ayó + bax + <<; 


a + bx + C, 


2 
ay EDI EC 


Fo) 
|_ Intervalo 1|| Intervalo 2 | Intervalo 3 
*o Xy * X3 33 
¿=0 i=1 =D i=3 


Figura 18.17 

Notación utilizada para obtener trazadores cuadráticos. Obser- 
2 ve que hay n intervalos y n + 1 puntos asociados con datos. El 
ejemplo mostrado es para n = 3. 
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4. Suponga que en el primer punto la segunda derivada es cero. Como la segunda derivada de la 
ecuación (18.28) es 2a,, entonces esta condición se puede expresar matemáticamente como 


aj=0 (18.34) 


La interpretación visual de esta condición es que los dos primeros puntos se unirán con una línea 
recta. 


EJEMPLO 18.9 Trazadores cuadráticos 


Planteamiento del problema Ajuste trazadores cuadráticos a los mismos datos que se utiliza- 
ron en el ejemplo 18.8 (tabla 18.1). Con los resultados estime el valor en x= 5. 


Solución En este problema se tienen cuatro puntos asociados con datos y n = 3 intervalos. Por lo 
tanto, 3(3) = 9 incógnitas que deben determinarse. Las ecuaciones (18.29) y (18.30) dan 2(3) - 2 = 
4 condiciones: 
20.254, +4.5b,+c,=1.0 
20.25a, + 4.5b, + c,=1.0 
49a,+ Tb,+c,=2.5 
49a; + Tb; + (3= 2.5 
Evaluando a la primera y la última función con los valores inicial y final, se agregan 2 ecuaciones 
más [ecuación (18.31)]: 


94, + 3b,+c,¡=2.5 
y [ecuación (18.32)] 
8laz+9b3+c3=0.5 
La continuidad de las derivadas crea adicionalmente de 3 — 1 = 2 condiciones [ecuación (18.33)]: 


9; + b; = 9a,+ b, 
14a, + b, = 14a; + bz 
Por último, la ecuación (18.34) determina que a, = 0. Como esta ecuación especifica a, de manera 


exacta, el problema se reduce a la solución de ocho ecuaciones simultáneas. Estas condiciones se 
expresan en forma matricial como 


151 00 0-0 0 00 0h 1 
0 0 2025 45 1 0 0 0llc 1 
0.0. 49 7 1 0 0 0|la| (25 
0.00. 0 0.0 49 7 1||o| 25 
3.10 0.0 0 00623 
0.00 0 0.0 81 9 1ilal 105S 
10 93 10.0 0 0||b, 0 
[0 0 14 1 0 -14 —1 O]lc, 


Estas ecuaciones se pueden resolver utilizando las técnicas de la parte tres, con los resultados: 
aj=0 bi=-1 c1=5.5 
a, = 0.64 b,=-6.76 c,= 18.46 
az=-1.6 bz=24.6 c3=-91.3 
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que se sustituyen en las ecuaciones cuadráticas originales para obtener la siguiente relación para cada 
intervalo: 


AC) ==+5,5 3.0<x<4,5 
fo) =0.64x? — 6.76x + 18.46 45<x<7.0 
A) =-1.612 + 24.6: — 91.3 7.0<x<9.0 


Cuando se usa f,, la predicción para x = 5 es, en consecuencia, 


FAS) = 0.64(5)? — 6.76(5) + 18.46 = 0.66 


El ajuste total por trazadores se ilustra en la figura 18.16b. Observe que hay dos desventajas que 
se alejan del ajuste: 1) la línea recta que une los dos primeros puntos y 2) el trazador para el último 
intervalo parece oscilar demasiado. Los trazadores cúbicos de la siguiente sección no presentan estas 
desventajas y, en consecuencia, son mejores métodos para la interpolación mediante trazadores. 


18.6.3 Trazadores cúbicos 


El objetivo en los trazadores cúbicos es obtener un polinomio de tercer grado para cada intervalo 
entre los nodos: 


f0)=ax + by? +cx+ d, (18.35) 


Así, para n + 1 puntos asociados con datos (i = 0, 1, 2,..., n) existen n intervalos y, en consecuencia, 
4n incógnitas a evaluar. Como con los trazadores cuadráticos, se requieren 4n condiciones para 
evaluar las incógnitas. Estas son: 


1. Los valores de la función deben ser iguales en los nodos interiores (2n — 2 condiciones). 
2. La primera y última función deben pasar a través de los puntos extremos (2 condiciones). 
3. Las primeras derivadas en los nodos interiores deben ser iguales (n — 1 condiciones). 

4. Las segundas derivadas en los nodos interiores deben ser iguales (n — 1 condiciones). 

5. Las segundas derivadas en los nodos extremos son cero (2 condiciones). 


La interpretación visual de la condición 5 es que la función se vuelve una línea recta en los nodos 
extremos. La especificación de una condición tal en los extremos nos lleva a lo que se denomina 
trazador “natural”. Se le da tal nombre debido a que los trazadores para el dibujo naturalmente se 
comportan en esta forma (figura 18.15). Si el valor de la segunda derivada en los nodos extremos no 
es cero (es decir, existe alguna curvatura), es posible utilizar esta información de manera alternativa 
para tener las dos condiciones finales. 

Los cinco tipos de condiciones anteriores proporcionan el total de las 4n ecuaciones requeridas 
para encontrar los 4n coeficientes. Mientras es posible desarrollar trazadores cúbicos de esta forma, 
presentaremos una técnica alternativa que requiere la solución de sólo n — 1 ecuaciones. Aunque la 
obtención de este método (cuadro 18.3) es un poco menos directo que el de los trazadores cuadráti- 
cos, la ganancia en eficiencia bien vale la pena. 

La deducción del cuadro 18.3 da como resultado la siguiente ecuación cúbica en cada intervalo: 


_ Fi, 1) 3 Fi(x,) 3 
a x) E x,_1) 
ER Fe, Mx, 0 
+ (x,-x) 
TN 6 
. Fx.) Pd x,1) (18.36) 
XX 6 


Esta ecuación contiene sólo dos incógnitas (las segundas derivadas en los extremos de cada interva- 
lo). Las incógnitas se evalúan empleando la siguiente ecuación: 
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Cuadro 18.3 Obtención de trazadores cúbicos 


El primer paso en la obtención (Cheney y Kincaid, 2008) se consi- 
dera la observación de cómo cada par de nodos está unida por una 
cúbica; la segunda derivada dentro de cada intervalo es una línea 
recta. La ecuación (18.35) se puede derivar dos veces para verificar 
esta observación. Con esta base, la segunda derivada se representa 
mediante un polinomio de interpolación de Lagrange de primer 
grado [ecuación (18.22)]: 

FO = Fi, + a 


X;_1 =X¡1 


(C18.3.1) 


donde f(x) es el valor de la segunda derivada en cualquier punto x 
dentro del ¡-ésimo intervalo. Así, esta ecuación es una línea recta, 
que une la segunda derivada en el primer nodo f”(x;_ ,) con la segun- 
da derivada en el segundo nodo f”(x;). 

Después, la ecuación (C18.3.1) se integra dos veces para obtener 
una expresión para f(x). Sin embargo, esta expresión contendrá dos 
constantes de integración desconocidas. Dichas constantes se evalúan 
tomando las condiciones de igualdad de las funciones [f(x) debe ser 
igual a Á(x,_ ¡) en x,_¡ y Áx) debe ser igual a Ax,) en x,)]. Al realizar 
estas evaluaciones, se tiene la siguiente ecuación cúbica: 


A e FU-1) 3 FE) 3 
a x) a." X,-1) 
ES Pa 
+ (x, —x) 
A 6 
| fx.) a 
y (x=X,_1) 
X, Xp 6 (C18.3.2) 


Ahora, es claro que esta relación es una expresión mucho más com- 
pleja para un trazador cúbico para el ¡-ésimo intervalo que, digamos, 


la ecuación (18.35). Sin embargo, observe que contiene sólo dos 
“coeficientes” desconocidos; es decir, las segundas derivadas al 
inicio y al final del intervalo: f(x, ¡) y F”(x;). De esta forma, si 
podemos determinar la segunda derivada en cada nodo, la ecuación 
(C18.3.2) es un polinomio de tercer grado que se utiliza para inter- 
polar dentro del intervalo. 

Las segundas derivadas se evalúan tomando la condición de que 
las primeras derivadas deben ser continuas en los nodos: 


Fix) =fi, 10%) 


La ecuación (C18.3.2) se deriva para ofrecer una expresión 
de la primera derivada. Si se hace esto tanto para el (i — 1)-ésimo, 
como para ¡-ésimo intervalos, y los dos resultados se igualan de 
acuerdo con la ecuación (C18.3.3), se llega a la siguiente relación: 


X;_ JA) 


(C18.3.3) 


(x, == XI, 1) + AUX 41 ll 
Hi CA) 


5 o NN F(,)] 
Xx =X; 


[fG6-1) FG)] (C18.3.4) 
Me A, 1 


Si la ecuación (C18.3.4) se escribe para todos los nodos interiores, 
se obtienen n — 1 ecuaciones simultáneas con n + 1 segundas deriva- 
das desconocidas. Sin embargo, como ésta es un trazador cúbico 
natural, las segundas derivadas en los nodos extremos son cero y el 
problema se reduce an—1 ecuaciones con n— 1 incógnitas. Además, 
observe que el sistema de ecuaciones será tridiagonal. Así, no sólo 
se redujo el número de ecuaciones, sino que las organizamos en una 
forma extremadamente fácil de resolver (recuerde la sección 11.1.1). 


(x, — leia + 2% 41 
== a 0 sd Í(,)1+ 


i+1 


de E S 


20 O) 


—— 2) FG)! (18.37) 


i-1 


Si se escribe esta ecuación para todos los nodos interiores, resultan n — 1 ecuaciones simultáneas 
con n — 1 incógnitas. (Recuerde que las segundas derivadas en los nodos extremos son cero.) La 
aplicación de estas ecuaciones se ilustra con el siguiente ejemplo. 


EJEMPLO 18.10 Trazadores cúbicos 


Planteamiento del problema Ajuste trazadores cúbicos a los mismos datos que se usaron en 
los ejemplos 18.8 y 18.9 (tabla 18.1). Utilice los resultados para estimar el valor en x = 5. 


Solución El primer paso consiste en usar la ecuación (18.37) para generar el conjunto de ecuacio- 
nes simultáneas que se utilizarán para determinar las segundas derivadas en los nodos. Por ejemplo, 
para el primer nodo interior se emplean los siguientes datos: 


x=3  fa)=25 
1=45 fa)=1 
m=7  fa)=25 
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Estos valores se sustituyen en la ecuación (18.37): 
(45-D 0+20-Df 4.5 + 0-4. 0) 


6 6 
= 2.5-1)+ 2.51 
7-45) á 43-30 y 


Debido a la condición de trazador natural, f”(3) = 0, y la ecuación se reduce a 
8f"(4.5) + 2.5 (7) =9.6 


En una forma similar, la ecuación (18.37) se aplica al segundo punto interior con el siguiente resul- 
tado: 


2.54 (4.5) + 97) = 9.6 
Estas dos ecuaciones se resuelven simultáneamente: 


f"(4.5) = 1.67909 
F(7)=-1.53308 


Estos valores se sustituyen después en la ecuación (18.36), junto con los valores de las x y las 
S0c), para dar 


1.67909 2.5 


a AA NS E 
sa a 
, | 1 1.6790%4.5- a E 
45-3 6 


FG) =0.186566(x — 3) + 1.666667(4.5 — x) + 0.246894(x — 3) 


Esta ecuación es el trazador cúbico para el primer intervalo. Se realizan sustituciones similares para 
tener las ecuaciones para el segundo y tercer intervalos: 


f.0) =0.11193907 — x)* — 0.102205(x — 4.5) - 0.299621(7 — x) 
+ 1.638783(x — 4.5) 


fe) =-0.127757(9 — x)? + 1.761027(9 — x) + 0.25(x 7) 


Las tres ecuaciones se pueden utilizar para calcular los valores dentro de cada intervalo. Por ejemplo, 
el valor en x = 5, que está dentro del segundo intervalo, se calcula como sigue 
FS) = 0.111939(7 — 5) - 0.102205(5 — 4.5)? - 0.299621(7 — 5) 
+ 1.638783(5 — 4.5) = 1.102886 


Se calculan otros valores y los resultados se grafican en la figura 18.16c. 


Los resultados de los ejemplos 18.8 a 18.10 se resumen en la figura 18.16. Observe cómo mejora 
progresivamente el ajuste conforme pasamos de trazadores lineales, a cuadráticos y cúbicos. También 
hemos sobrepuesto un polinomio de interpolación cúbica en la figura 18.16c. Aunque el trazador cúbi- 
co consiste de una serie de curvas de tercer grado, el ajuste resultante difiere del obtenido al usar un 
polinomio de tercer grado. Esto se debe al hecho de que el trazador natural requiere segundas deriva- 
das iguales a cero en los nodos extremos; mientras que el polinomio cúbico no tiene tal restricción. 
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18.6.4 Algoritmo computacional para trazadores cúbicos 


El método para calcular trazadores cúbicos, descrito en la sección anterior, es ideal para implemen- 
tarse en una computadora. Recuerde que, con algunas manipulaciones inteligentes, el método se 
reduce a la solución de n — 1 ecuaciones simultáneas. Un beneficio más de la derivación es que, como 
lo especifica la ecuación (18.37), el sistema de ecuaciones es tridiagonal. Como se describió en la 
sección 11.1, existen algoritmos para resolver tales sistemas de una manera extremadamente eficien- 
te. La figura 18.18 muestra una estructura computacional que incorpora esas características. 

Observe que la rutina de la figura 18.18 da sólo un valor interpolado, yu, para un valor dado de 
la variable dependiente, xu. Ésta es sólo una forma en la cual se puede implementar la interpolación 
mediante trazadores. Por ejemplo, usted deseará determinar los coeficientes una sola vez y, después, 
realizar muchas interpolaciones. Además, la rutina da tanto la primera (dy) como la segunda deri- 
vadas (dy?) en xu. Aunque no es necesario calcular esas cantidades, son útiles en muchas aplicacio- 
nes de la interpolación mediante trazadores. 


18.7 INTERPOLACIÓN MULTIDIMENSIONAL 


Los métodos de interpolación para problemas unidimensionales se pueden extender a la interpolación 
multidimensional. En esta sección se describirá el caso más sencillo de interpolación bidimensional 
en coordenadas cartesianas. 


SUBROUTINE Interpol (x,y,n,d2x,xu, yu, dy,d2y) 


LOCAL €n, fn> In, F"n» 0d2Xp ñag = 0 
CALL Tridiag(x,y,n,e,f,9,r) í= 1] 
CALL Decomp(e,f,g,n-1) DO 
CALL Subst(e,f,g,r,n-1,d2x) IF xu > X;-1 AND xu< Xx; THEN 
CALL Interpol(x,y,n,d2x,xu, yu, dy,d2y) cl = dex; 116/(X; = Xj-1) 
END Spline c2 = dex¡/6/(x; -= X;-1) 
03 = Yi (xj => X51) >= 02xX53 * (Xx;7X3-1)/6 
SUBROUTINE Tridiag (x,y,n,e,f,9,r) CA = Yi/(x; => Xj51) >= 02x; * (x;7X5-1)/6 
F, = 2 * (X2Xg) tl = cl * (x, - xu) 
91 = (X27X1) 12 = (02 * (xu - X¡1)% 
ri = 6/(x2X1) * (Y2-Y1) O 
ri = rir6/(xi7X0) * (Yo7Y1) 14 = 04 * (xu - X7-1) 
DOFOR T= 2, n-2 yu= tl + t2+ t3+ t4 
es = (X;7X;-1) tl=-3 * cl * (x, - xu) 
Fi = 2 * Oe = Xi) t2= 3 * c2 * (xu - xj) 
9 = (Xi 7 Xj) t3 = -c3 
ri = 6 (Xi 7 Xx) * (Yi 7 Y¡) t4 = cd 
ri = TiFEl(X; > Xi) * (Yi > Yi) dy tl + t2+ t3+ t4 
END DO tl=6*c1*(x, - xu) 
O PD, t2= 6 * c2 * (xu - Xp1) 
Pas 12 GR a) d2y = tl + t2 
Pa1  6/UXp > Xp1) * (Yn 7 Yn-1) ñag = 1 
Pra = Pa1 + 6ÍUXp1 7 Xp2) * (Yn-2 7 Yn-1) ELSE 
END Tridiag i=31+1 
END IF 
IFi¡=n+* 10R flag = 1 EXIT 
END DO 
IF flag = 0 THEN 
PRINT “outside range” 
pause 
END IF 
END Interpol 
Figura 18.18 


Algoritmo para la interpolación mediante trazadores cúbicos. 
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18.7.1 Interpolación bilineal 


La interpolación bidimensional sirve para determinar valores inter- 

medios para funciones de dos variables, z = f(x; y;). Como se ilustra en fa, y) 
la figura 18.19, se tienen valores en cuatro puntos: f(x, y1), f(Qc2, y 1), 

FG, y2) y f(Xo, y2). Se desea interpolar entre estos puntos para estimar Fac) d6hnd 
el valor de un punto intermedio f(x; y;). Si se usa una función lineal, e) Dr” 
el resultado es un plano que conecta los puntos como en la figura 18.19. 

Tales funciones se conocen como bilineales. 


OS, y1) 
I 
En la figura 18.20 se ilustra una forma sencilla de desarrollar la | 
I 
I 
! 
l 


función bilineal. Primero, se puede mantener fijo el valor de y y apli- 
car interpolación lineal unidimensional en la dirección x. Usando la 


I 
I 
I 
I 
I 
| 
forma de Lagrange, el resultado en (x;, y,) es | 


Xi; — X2 Xx; — X1 
Fi, y) = FG, yn + Fa, y1) (18.38) 
X1 —X X2 — X1 
y en (X;, y2) es Figura 18.19 
Ilustración gráfica de interpolación bidimensional bili- 
FO, ya) = Aj — X2 FG ya) + Xi — X1 Fa, ya) (18.39) neal, en la que un valor intermedio (círculo relleno) se 
a E E e E : estima con base en cuatro valores dados (círculos en 
blanco). 


Estos puntos se pueden entonces usar para interpolar linealmente a lo 
largo de la dimensión y para obtener el resultado final, 


MER O dl 
Fi, Yi) = 2 Y) + Fi, y2) (18.40) 

y1> Y2— Y 
Se puede desarrollar una sola ecuación sustituyendo las ecuaciones (18.38) y (18.39) en la ecuación 
(18.40) para dar 


Xi =X2 Yi — Y2 i¡TX1 Yi — Y2 


X 
Fi, Yi) = ——— f(1, y1) + F(x2, y1) 
X1—X2Y1— Y X2 —X1Y1— Y2 ia 
Xi; 7 X2 Yi — Y1 Xi =X1 Yi — Y1 ] 
y) - f(x2, yo) 
XI — X2 Y2 — Y1 X2 == X1 Y2— Y1 


EJEMPLO 18.11  Interpolación bilineal 
Planteamiento del problema Suponga que ha medido temperaturas en varias coordenadas en 
la superficie de una placa rectangular calentada: 

TQ,10)=60  T7(9,1)=57.5 

TQ,6)=55  T(9,6)=70 


Xx Xx; * 


Mo e 


A a O) 
FG, y1) Fi, yy) FO, y) 
Figura 18.20 
Ss y La interpolación bidimensional bilineal se puede implementar aplicando 
FLY) primero interpolación lineal unidimensional a lo largo de la dimensión x 
para determinar valores de x;. Estos valores se pueden entonces usar para 
| interpolar linealmente a lo largo de la dimensión y para obtener el resulta- 
iS O o do final en x, y. 


F (1, ya) Fr, y2) 
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Use interpolación bilineal para estimar la temperatura en x,= 5.25 y y; = 4.8. 
Solución Al sustituir estos valores en la ecuación (18.41) se obtiene 
525-9486 525-2486 
5.5, 4) = 60 ILS 
Á ) 2-9 1-6 de 9-2 1-6 
5.259 4.8-—1 5.25-2 4.8-—1 
55 70 = 61.2143 
2-9 6-1 AS 9-2 6-1 
Observe que más allá de la sencilla interpolación bilineal descrita en el ejemplo anterior, también 
se pueden usar polinomios de grado más alto y trazadores para interpolar en dos dimensiones. Ade- 
más, estos métodos se pueden extender fácilmente a tres dimensiones. Se volverá a este tema en la 
reseña de aplicaciones de software para interpolación al final del capítulo 19. 
PROBLEMAS 


18.1 Estime el logaritmo natural de 10 por medio de interpolación 

lineal. 

a) Interpole entre log 8 = 0.9030900 y log 12 = 1.0791812. 

b) Interpole entre log 9 = 0.9542425 y log 11 = 1.0413927. Para 
cada una de las interpolaciones calcule el error relativo porcen- 
tual con base en el valor verdadero. 

18.2 Ajuste un polinomio de interpolación de Newton de segundo 

grado para estimar el log 10, con los datos del problema 18.1 en x= 

8, 9 y 11. Calcule el error relativo porcentual verdadero. 

18.3 Ajuste un polinomio de interpolación de Newton de tercer 

grado para estimar log 10 con los datos del problema 18.1. 

18.4 Repita los problemas 18.1 a 18.3 usando el polinomio de La- 

grange. 

18.5 Dados los datos 


x | 16 2 25 3.2 4 45 
ft | 2 8 14 15 8 2 


a) Calcule f(2.8) con el uso de polinomios de interpolación de 
Newton de grados 1 a 3. Elija la secuencia de puntos más 
apropiada para alcanzar la mayor exactitud posible para sus 
estimaciones. 

b) Utilice la ecuación (18.18) para estimar el error de cada predic- 
ción. 

18.6 Dados los datos 


fo | 3 6 19 99 291 444 


Calcule (4) con el uso de polinomios de interpolación de Newton de 
grados 1 a 4. Elija los puntos base para obtener una buena exactitud. 
¿Qué indican los resultados en relación con el grado del polinomio 
que se emplea para generar los datos de la tabla? 

18.7 Vuelva a hacer el problema 18.6 con el uso de polinomios de 
Lagrange de grados 1 a 3. 

18.8 Los siguientes datos provienen de una tabla y fueron medidos 
con alta precisión. Use el mejor método numérico (para este tipo de 
problema) para determinar y en x = 3.5. Observe que un polinomio 
dará un valor exacto. Su solución debe probar que su resultado es 
exacto. 


x | 0 1.8 5 6 E 
y | 26 16415 5375 35 2015 254 8 


18.9 Use el polinomio de interpolación de Newton para determinar 
y en x= 3.5 con la mayor exactitud posible. Calcule las diferencias 
divididas finitas como en la figura 18.5 y ordene sus puntos para 
obtener exactitud Óptima y convergencia. 


x [0 1 58 3 4.5 5 6 
y |2 54375 73516 7.5625 8.4453 9.1875 12 


18.10 Use el polinomio de interpolación de Newton para determinar 
y en x= 8 con la mayor exactitud posible. Calcule las diferencias 
divididas finitas como en la figura 18.5 y ordene sus puntos para 
obtener exactitud Óptima y convergencia. 


x [0 1 2. 585 41 13 16 18 
y Jos 3.134 53 99 102 935 72 62 


18.11 Emplee interpolación inversa con el uso de un polinomio de 
interpolación cúbico y de bisección, para determinar el valor de x que 
corresponde a f(x) = 0.23, para los datos tabulados que siguen: 


2 3 4 5 6 7 
y | 05 03333 025 02 0.1667 1.1429 


18.12 Utilice interpolación inversa para determinar el valor de x que 
corresponde a f(x) = 0.85, para los datos tabulados siguientes: 


0 1 2 3 4 5 
Fx) | 0 0.5 0.8 0.9 0.941176 0.961538 


Observe que los valores de la tabla se generaron con la función Ax) 
=%/(1 +13). 
a) Determine en forma analítica el valor correcto. 
b) Use interpolación cúbica de x versus y. 
c) Utilice interpolación inversa con interpolación cuadrática y la 
fórmula cuadrática. 


d) Emplee interpolación inversa con interpolación cúbica y bisec- 
ción. Para los incisos b) a d) calcule el error relativo porcentual 
verdadero. 

18.13 Desarrolle trazadores cuadráticos para los cinco primeros 
puntos asociados con datos del problema 18.5, y pronostique (3.4) 
y /(Q.2). 

18.14 Obtenga trazadores cúbicos para los datos del problema 18.6, 
y a) pronostique (4) y 2.5), y b) verifique que (3) y K£(3) = 19. 
18.15 Determine los coeficientes de la parábola que pasa por los 
últimos tres puntos del problema 18.5. 

18.16 Determine los coeficientes de la ecuación cúbica que pasa por 
los primeros cuatro puntos del problema 18.6. 

18.17 Desarrolle, depure y pruebe un programa en cualquier lengua- 
je de alto nivel o de macros que elija, para implantar la interpolación 
de polinomios de Newton, con base en la figura 18.7. 

18.18 Pruebe el programa que desarrolló en el problema 18.17 con 
la duplicación del cálculo del ejemplo 18.5. 

18.19 Use el programa que desarrolló en el problema 18.17 para 
resolver los problemas 18.1 a 18.3. 

18.20 Utilice el programa que desarrolló en el problema 18.17 para 
solucionar los problemas 18.5 y 18.6. Utilice todos los datos para de- 
sarrollar polinomios de primero a quinto grados. Para ambos problemas, 
haga la gráfica del error estimado versus el grado. 

18.21 Desarrolle, depure y pruebe un programa en el lenguaje de 
alto nivel o macros que elija, para implantar la interpolación de La- 
grange. Utilice como base el pseudocódigo de la figura 18.11. Prué- 
belo con la duplicación del ejemplo 18.7. 

18.22 Una aplicación útil de la interpolación de Lagrange se deno- 
mina búsqueda en la tabla. Como el nombre lo indica, involucra 
“buscar” un valor intermedio en una tabla. Para desarrollar dicho 
algoritmo, en primer lugar se almacena la tabla de los valores de x y 
KG) en un par de arreglos unidimensionales. Después, dichos valores 
se pasan a una función junto con el valor de x que se desea evaluar. 
La función hace luego dos tareas. En primer lugar, hace un ciclo 
hacia abajo de la tabla hasta que encuentra el intervalo en el que se 
localiza la incógnita. Después aplica una técnica como la interpolación 
de Lagrange para determinar el valor apropiado de f(x). Desarrolle 
una función así con el uso de un polinomio cúbico de Lagrange para 
ejecutar la interpolación. Para intervalos intermedios ésta es una 
buena elección porque la incógnita se localiza en el intervalo a la mitad 
de los cuatro puntos necesarios para generar la expresión cúbica. Para 
los intervalos primero y último, use un polinomio cuadrático de 
Lagrange. Asimismo, haga que el código detecte cuando el usuario 
pida un valor fuera del rango de las x. Para esos casos, la función 
debe desplegar un mensaje de error. Pruebe su programa para Ax) = 
ln x con los datos x= 1,2, ..., 10. 

18.23 Desarrolle, depure y pruebe un programa en cualquier lenguaje 
de alto nivel o de macros de su elección, para implantar la interpola- 
ción con splin cúbico con base en la figura 18.18. Pruebe el programa 
con la repetición del ejemplo 18.10. 

18.24 Emplee el software desarrollado en el problema 18.23 para 
ajustar trazadores cúbicos para los datos de los problemas 18.5 y 18.6. 
Para ambos casos, pronostique (2.25). 

18.25 Emplee la porción de la tabla de vapor que se da para el H,O 
sobrecalentado a 200 MPa, para a) encontrar la entropía correspon- 
diente s para un volumen específico v de 0.108 m*/kg con interpola- 
ción lineal, b) encontrar la misma entropía correspondiente con el 
uso de interpolación cuadrática, y c) hallar el volumen correspon- 
diente a una entropía de 6.6 con el empleo de interpolación inversa. 
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v (m?/kg) 
s (kJ/kg - K) 


| 0.10377 
| 6.4147 


0.11144 
6.5453 


0.1254 
6.7664 


18.26 La función de Runge se escribe como 


a) Desarrolle una gráfica de esta función para el intervalo de x = 
-1a1l. 

b) Genere y grafique el polinomio de interpolación de Lagrange 
usando valores de función equiespaciados correspondientes a 
x=-1,-0.5, 0, 0.5 y 1. 

c) Use los cinco puntos de b) para estimar (0.8) con polinomios 
de interpolación de Newton de grado primero a cuarto. 

d) Genere y grafique un trazador cúbico usando los cinco puntos 
de b). 

e) Explique sus resultados. 

18.27 La siguiente es la función incorporada de gibas que usa MATLAB 

para demostrar algunas de sus capacidades numéricas: 


1 1 
x — 0.3) + 0.01 bj (x — 0.9)? + 0.04 


Fo) = ¿ 


La función de gibas muestra regiones tanto llanas como escarpadas 
a lo largo de un rango relativamente corto de x. Genere valores de 
esta función a intervalos de 0.1 en el rango de x=0 a 1. Ajuste estos 
datos con un trazador cúbico y cree una gráfica que compare el 
ajuste con la función exacta de gibas. 

18.28 Los siguientes datos definen la concentración de oxígeno di- 
suelto a nivel del mar para agua dulce como función de la temperatura: 


TEC 0 8 16 24 32 40 


o, mg/L | 14.621 11.843 9870 8.418 7.305 6.413 


Estime o0(27) usando: a) interpolación lineal, b) polinomio de inter- 
polación de Newton y c) trazadores cúbicos. Observe que el resulta- 
do exacto es 7.986 mg/L. 

18.29 Genere ocho puntos igualmente espaciados de la función 


FA =sen? ft 


De1=0a271. Ajuste estos datos con a) un polinomio de interpolación 
de séptimo grado y b) un trazador cúbico. 

18.30 Se miden temperaturas en varios puntos de una placa calen- 
tada (tabla P18.30). Estime la temperatura en a) x=4, y = 3.2 y b) 
x=4.3,y=2.7. 


Tabla P18.30 Temperatura (*C) en varios puntos de una 
placa calentada cuadrada. 


x=0 x=2 x=4 x=6 x=8 
y=0 100.00 90.00 80.00 70.00 60.00 
y=2 85.00 64.49 53.50 48.15 50.00 
y=4 70.00 48.90 38.43 35.03 40.00 
y=6 55.00 38.78 30.39 27.07 30.00 
y=8 40.00 35.00 30.00 25.00 20.00 


Aproximación de Fourier 


Hasta aquí, en nuestra presentación de la interpolación se han destacado los polinomios estándar, es 
decir, las combinaciones lineales de los monomios 1, x, x?,..., x” (figura 19.1a). Ahora veremos otra 
clase de funciones que son trascendentales en la ingeniería. Éstas son las funciones trigonométricas 
1, cos x, cos 2x,..., cos nx, sen x, sen 2x,..., sen nx (figura 19.10). 

Los ingenieros a menudo tratan con sistemas que oscilan o vibran. Como es de esperarse, las 
funciones trigonométricas juegan un papel importante en el modelado de tales problemas. La aproxi- 
mación de Fourier representa un esquema sistemático para utilizar series trigonométricas con este 
propósito. 

Una de las características distintivas del análisis de Fourier es que trata con los dominios de la 
frecuencia y del tiempo. Como algunos ingenieros requieren trabajar con el último, se ha dedicado 
gran parte del siguiente material a ofrecer una visión general de la aproximación de Fourier. Un 
aspecto clave de esta visión será familiarizarse con el dominio de la frecuencia. Luego de dicha 
orientación se presenta una introducción a los métodos numéricos para calcular transformadas de 
Fourier discretas. 


19.1 AJUSTE DE CURVAS CON FUNCIONES SINUSOIDALES 


Una función periódica f(£) es aquella para la cual 
RO =ft+T) (19.1) 


donde Tes una constante llamada el periodo, que es el 
valor menor para el cual es válida la ecuación (19.1). 
Entre los ejemplos comunes se encuentran diversas 
formas de onda, como ondas cuadradas y dientes de 


sierra (figura 19,2). Las ondas fundamentales son las 
funciones sinusoidales. 

En el presente análisis se usará el término sinusoi- 
de para representar cualquier forma de onda que se 
pueda describir como un seno o un coseno. No existe 
una convención muy clara para elegir entre estas fun- 
ciones y, en cualquier caso, los resultados serán idénticos. 
En este capítulo se usará el coseno, que generalmente 
se expresa como 


KO =As + C; cos(wyt + 0) (19.2) 


Figura 19.1 
a) Los primeros cinco monomios y b) funciones trigo- 


nométricas. Observe que en los intervalos mostrados, 
ambos tipos de funciones están en el rango de -1 a 1. 
Sin embargo, advierta que los valores pico de los mo- 
nomios se presentan todos en los extremos; mientras 
que en las funciones trigonométricas los picos están 
uniformemente distribuidos en todo el intervalo. 


19.1 Ajuste de curvas con funciones sinusoidales 


Figura 19.2 
Además de las funciones trigonométricas seno y coseno, las fun- 
ciones periódicas comprenden formas de onda como a) la onda 
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cuadrada y b) la onda dientes de sierra. Más allá de estas formas a) 
idealizadas, las señales periódicas en la naturaleza pueden ser c) 

no ideales y d) contaminadas por ruido. Las funciones trigonomé- Soo 

tricas sirven para representar y analizar todos estos casos. LT ——>| 


Así, cuatro parámetros sirven para caracterizar la sinusoide (fi- 


b 
gura 19.3). El valor medio Ay, establece la altura promedio sobre 


las abscisas. La amplitud C; especifica la altura de la oscilación. 
La frecuencia angular (w, caracteriza con qué frecuencia se LT > 
presentan los ciclos. Finalmente, el ángulo de fase, o corrimien- 

to de fase 0, parametriza en qué extensión la sinusoide está co- "e 

rrida horizontalmente. Esto puede medirse como la distancia en 


radianes desde f = 0 hasta el punto donde la función coseno em- c) 
pieza un nuevo ciclo. Como se ilustra en la figura 19.4a, un valor 

negativo se conoce como un ángulo de fase de atraso, ya que la 

curva cos(wy!—0) comienza un nuevo ciclo de O radianes después o 
del cos(wyt). Así, se dice que cos(wyí — 0) tiene un retraso 
cos(wyt). En forma opuesta, como se muestra en la figura 19.4b, 
un valor positivo se refiere como un ángulo de fase de adelanto. 


Observe que la frecuencia angular (en radianes/tiempo) se se 
relaciona con la frecuencia f (en ciclos/tiempo) mediante 
wm, =21f (19.3) 
y, a su vez, la frecuencia está relacionada con el periodo T (en 
unidades de tiempo) mediante 
f= l (19.4) 
T 


Aunque la ecuación (19.2) representa una caracterización matemática adecuada de una sinusoi- 
de, es difícil trabajar desde el punto de vista del ajuste de curvas, pues el corrimiento de fase está 
incluido en el argumento de la función coseno. Esta deficiencia se resuelve empleando la identidad 
trigonométrica 


C, cos(wyt + 0) = C,[cos(wyt) cos(0) — sen(wyt) sen(0)] (19.5) 


Sustituyendo la ecuación (19.5) en la (19.2) y agrupando términos se obtiene (figura 19.3b) 


KO =A,+A; cosíwyt) + B, sen(wat) (19.6) 
donde 
A¡ =C, cos(0) B,=-C, sen(0) (19.7) 


Dividiendo las dos ecuaciones anteriores y despejando se obtiene 


0= an - A) (19.8) 


1 


donde, si 4, < 0, sume 7 a Ó. Si se elevan al cuadrado y se suman las ecuaciones (19.7) llegaríamos a 


C, =x/A; + Bj (19.9) 
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Figura 19.3 

a) Una gráfica de la función sinusoidal y(t) = A, + C, cos(wyt 
+ 6). En este caso, Ay=1.7, C,=1,0,=27/T =211/(1.5 Ss), y 

0 = 1/3 radianes = 1.0472 (=0.25 s). Otros parámetros que se 
utilizan para describir la curva son la frecuencia f= wy/(Q70), 


que en este caso es 1 ciclo/(1.5 s), y el periodo T= 1.5 s. b) 
Una expresión alternativa para la misma curva es y(t) = Ay + 
A, cos(wyt) + B, sen(w,1). Los tres componentes de esta fun- 


ción se ilustran en b), donde A, =0.5 y B, = 0.866. La suma 


> de las tres curvas en b) da como resultado la curva simple 
en a). 


Así, la ecuación (19.6) representa una fórmula alternativa de 
la ecuación (19.2) que también requiere cuatro parámetros; 
pero que se encuentra en el formato de un modelo lineal 
general [recuerde la ecuación (17.23)]. Como se analizará 
en la próxima sección, es posible aplicarlo simplemente como 
base para un ajuste por mínimos cuadrados. 

Sin embargo, antes de iniciar con la próxima sección, 


A; 


B, sen (wpt) 


se deberá resaltar que se puede haber empleado la función 
seno en lugar de coseno, como modelo fundamental de la 
ecuación (19.2). Por ejemplo, 


A, cos (wpt) 
b 
4 KO =A, + C, seníc0! + Ó) 
se pudo haber usado. Se aplican relaciones simples para 


convertir una forma en otra: 


sen(0,t +0) = cos 0! +0- 2) 


cos(0,t +0) = sen oyr+0+3) (19.10) 


En otras palabras, O = O — 72/2. La única consideración importante es que se debe usar una u 
otra forma de manera consistente. Aquí, usaremos la versión coseno en todo el análisis. 


19.1.1 Ajuste por mínimos cuadrados de una sinusoide 


La ecuación (19.6) se entiende como un modelo lineal por mínimos cuadrados 

y =A¿+A, cos(wpt) + B, sen(wyt) + e (19.11) 
que es sólo otro ejemplo del modelo general [recuerde la ecuación (17.23)] 

Y = Agzy + 0121 + 0222 + +++ + AZ + € (17.23) 


donde zy = 1, z, = cos(w4L), zo = sen(wyt) y todas las otras z = 0. Así, nuestro objetivo es determinar 
los valores de los coeficientes que minimicen la función 


N 
S,= Y (y, 14, +4, cos(0y1,)+ B, sen(yt,)1 Y 


i=l 


Las ecuaciones normales para lograr esta minimización se expresan en forma matricial como [re- 
cuerde la ecuación (17.25)] 
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> 
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cos (wpt) 
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a) 


cos (or ++ a 


Figura 19.4 

Representaciones gráficas de a) un ángulo de fase de 
atraso y b) un ángulo de fase de adelanto. Observe que 
la curva atrasada en a) puede describirse de manera al- 
ternativa como cos(w,t + 372/2). En otras palabras, si una 
curva se atrasa en un ángulo a, también se puede repre- 


b) sentar como adelanto en 27 — «z. 
N Y cos(0,t) Y sen(0,t) As 
Y cos(0,t) Y cos” (0,t) Y cos(0,1) sen(0,t) |< 4, 
sen(o,t) *cos(w,t) sen(o,t) Ysen*(0,t) Bi 
2y 
=3 Y ycos(0,t) (19.12) 
Y y sen(0,t) 


Estas ecuaciones sirven para encontrar los coeficientes desconocidos. Aunque, en lugar de hacer 
esto, se examina el caso especial donde hay N observaciones espaciadas de manera uniforme a in- 
tervalos At y con una longitud total T = (V— 1)Az. En esta situación, se determinan los siguientes 
valores promedio (véase el problema 19.1): 


Ysen(0,t) =0 Y cos(0,t) =0 
N N 
Y sen (0,t) 1 Y cos" (yt) al 
N == 2 N = 2 (19.13) 
2 cos(0w,t) sen(wyt) 0 


N 


Así, para los puntos igualmente espaciados, las ecuaciones normales se convierten en 


N 0 0T]ÍA, y 
0 N2 0 [34 p=3 2 ycos(0,t) 
0 0 NA||B Y y sen(0,t) 


La inversa de una matriz diagonal es simplemente otra matriz diagonal, cuyos elementos son los 
recíprocos de la matriz original. Así, los coeficientes se determinan como 


Ay| [IN 0 0 ay 
Ajp=| 0 2N 0 [3% ycos(0,1) 
B, 0 0  2/N||* ysen(0,t) 
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o 

4 =2 
N (19.14) 
2 

A, == Y ycos(0,t) 
N (19.15) 
2 

B, =—2 y sen(0,1) 
N (19.16) 


EJEMPLO 19.1 Ajuste por mínimos cuadrados a una sinusoide 


Planteamiento del problema La curva de la figura 19.3 se describe por y = 1.7 + cos(4.1891 + 
1.0472). Genere 10 valores discretos para esta curva a intervalos At = 0.15 en el intervalo de 1=0a 
t = 1.35. Utilice esta información para evaluar los coeficientes de la ecuación (19.11) mediante un 
ajuste por mínimos cuadrados. 


Solución Los datos requeridos para evaluar los coeficientes con (w = 4.189 son 


t y y cos(wyt) y sen(wyt) 


0 2.200 2.200 0.000 
0.15 1.595 1.291 0.938 
0.30 1.031 0.319 0.980 
0.45 0.722 0.223 0.687 
0.60 0.786 0.636 0.462 
0.75 1.200 -1.200 0.000 
0.90 1.805 -1.460 1.061 
1.05 2.369 0.732 2.233 
1.20 2.678 0.829 -2.547 
1.35 2.614 2.114 -1.536 
»= 17.000 2.502 -4.330 


Estos resultados se utilizan para determinar [ecuaciones (19.14) a (19.16)] 


17. 2 2 
A, = E =1.7 A, = 2.502 = 0.500 B, = (4.330) = -0.866 
10 10 10 
De esta manera, el ajuste por mínimos cuadrados es 
y = 1.7 + 0.500 cos(w,t) — 0.866 sen(wyt) 


El modelo se expresa también en el formato de la ecuación (19.2) calculando [ecuación (19.8)] 


( —0.866 
0 =arctan| — 
0.500 


) =1.0472 


y [ecuación (19.9)] 


C, =4/(0.5)? +(-0.866)? =1.00 
cuyo resultado es 


y =1.7 + cos(wyt + 1.0472) 


o, en forma alternativa, con seno utilizando la ecuación (19.10) 


y = 1.7 + sen(wyt + 2.618) 


19.2 Serie de Fourier continua 


El análisis anterior se puede extender al modelo general 


KO =A,+A,; cosí(wyt) + B, sen(w,t) + A, cos(20)t) + B, sen2w.t) 
+ +: +A, cos(mopt) + B,, sen(mouyt) 


donde, para datos igualmente espaciados, los coeficientes se evalúan con 


-2y 


a 


2 : 
A,= yO 

2 j=1L2,....m 
B, = y sen(j0,t) 


Aunque estas relaciones se utilizan para ajustar datos en el sentido de la regresión (es decir, 
N > 2m + 1), una aplicación alternativa es emplearlos para la interpolación o colocación (es de- 
cir, usarlos en el caso donde el número de incógnitas, 2m + 1, es igual al número de datos, N). Éste 
es el procedimiento usado en la serie de Fourier continua, como se estudiará a continuación. 


19.2 SERIE DE FOURIER CONTINUA 


En el curso del estudio de problemas de flujo de calor, con el análisis de Fourier se demostró que 
una función periódica arbitraria se representa por medio de una serie infinita de sinusoides con 
frecuencias relacionadas de manera armónica. Para una función con un periodo 7; se escribe una 
serie de Fourier continua! 


KO = ay + a, cos(wat) + b, sent) + a, cos(209t) + b, senQuwat) +: 


o, de manera concisa, 


f0=a,+ y [a, cos(ko, 1) +b, sen(ko,t)] (19.17) 


k=1 


donde Wwy = 271 /T se denomina la frecuencia fundamental y sus múltiplos constantes 20 y, 304, etc., 
se denominan armónicos. De esta forma, la ecuación (19.17) expresa a f(£) como una combinación 
lineal de las funciones base: 1, cos(wWy£), sen(wWy£), cos(20/1), senQwal),... 

Como se describe en el cuadro 19.1, los coeficientes de la ecuación (19.17) se calculan por medio 
de 


2 T 
a, = —) f0)cos(ko,t) dt (19.18) 
0 


8 T 
b, = | (0) sentko,t) de (19.19) 
T vo 


parak=1,2,... y 


1 T 
a, = al] 0 di (19.20) 


La existencia de las series de Fourier está referida en las condiciones de Dirichlet, las cuales especifican que la función 
periódica tiene un número finito de máximos y mínimos, y que hay un número finito de saltos discontinuos. En general, todas 
las funciones periódicas obtenidas físicamente satisfacen tales condiciones. 
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Cuadro 19.1 Determinación de los coeficientes de la serie de Fourier continua 


Como se hizo para los datos discretos de la sección 19.1.1, se esta- en la cual se despeja para tener 
blecen las siguientes relaciones: 
T 
j JC) dí 
a, = 2 — 


T T 
j sen(k0,1) dt =/ cos(k0,1) dí =0 (C19.1.1) E T 
0 0 
Así, a, es simplemente el valor medio de la función a lo largo del 
T . 
j cos(k0w,t) sen(g0,t) dt =0 (C19.1.2) periodo. eE , 
o Para evaluar uno de los coeficientes del coseno, por ejemplo, a,,, 
la ecuación (19.17) se multiplica por (mot) e integra para dar 
T 
j sen(k0,t) sen(g0,1) dt =0 (C19.1.3) r 7 
il j FM) cos(mo,t) dt = j a, cos(m0,t) di 
0 0 
T Te 
J cos(k0,) cos(g0,t) di =0 (C19.1.4) +| y a, cos(kw,t) cos(mo,t) di 
0 o 
pa 
; , r + j Y», sen(ko,1) cos(mo,1) dt (C19.1.6) 
j sen(k0,t) dt= j cos (k0,t) dt = 2 (C19.1.5) ¡e 
0 0 


En las ecuaciones (C19.1.1), (C19.1.2) y (C19.1.4) se observa que 
todos los términos del lado derecho son cero, con excepción del caso 
donde k = m. Este último caso se puede evaluar con la ecuación 
7 id y e (C19.1.5) y, por lo tanto, de la ecuación (C19.1.6) se obtiene a,,, O 
j HF) dt =| A, dr+ | 3 [a, cos(k0,t) de manera más general [ecuación (19.18)], 

0 0 0 par 


Para evaluar los coeficientes, cada lado de la ecuación (19.17) se 
integra obteniéndose 


F 
+ b, sen(kwyt)] dt e E j aná 
0 


Como cada término en la sumatoria es de la forma de la ecuación 
(C19.1.1), la ecuación se convierte en para k=1,2,... 


$ En forma similar, la ecuación (19.17) se multiplica por sen(mwy), 
f FO dt=a,T se integra y se manipula para dar la ecuación (19.19). 


EJEMPLO 19.2 Aproximación de la serie de Fourier continua 


Planteamiento del problema Utilice la serie de Fourier continua para aproximar la función 
de onda cuadrada o rectangular (figura 19.5) 


-1 =T/2<t<-—T/4 
fFo=3 1 —-T/4<t< T/4 
—-1 Tl4<t< TN 


Solución Como la altura promedio de la onda es cero, se obtiene en forma directa un valor de 
ay = 0. Los coeficientes restantes se evalúan como sigue [ecuación (19.18)] 


T/2 


a=> FO cos(ko,t) dt 
T J-r/2 
2 —T/4 T/4 TI 
ze 21 cos(k0,t) dt +] cos(k0,!) dt -| cos(k00,!) a 
T -T/2 —T/4 T/4 


Las integrales se evalúan para dar 


19.2 Serie de Fourier continua 


Figura 19.5 
Una forma de onda cuadrada o rectangular con 
una altura de 2 y un periodo T= 27/04. 


Es cos (wpt) 
T 


4 
37 os [E1077)) 


Figura 19.6 

y La aproximación de la serie 

A de Fourier para la onda cua- 

Gn “os (Sw) drada de la figura 19.5. El 
conjunto de gráficas muestra 
la suma hasta, e incluyendo, 
el a) primer, b) segundo y c) 
tercer términos. Se presentan 
también los términos indivi- 
duales que se fueron agre- 
o gando en cada etapa. 


AN(krc) para k=1,5,9,... 
a, =3AM(kT) para k=3,7,11,... 


0 para k = pares enteros 


De manera similar, se determina que todas las b = 0. Entonces, la aproximación de la serie de Fourier es 


FO= o = L os(30m,t) + L cos(so,t) = L os(10,1) +... 
TT 37 ST TT 
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Los resultados hasta los primeros tres términos se muestran en la figura 19.6. 

Debe mencionarse que a la onda cuadrada de la figura 19.5 se le llama función par, ya que f(t) = 
FE). Otro ejemplo de una función par es cos(£). Se puede demostrar (Van Valkenburg, 1974) que las 
b, en la serie de Fourier siempre son iguales a cero en las funciones pares. Observe también que 
las funciones impares son aquellas en las que f(t) = —f(—£). La función sen(t) es una función impar. 
En este caso las a, serán iguales a cero. 


Además de la forma trigonométrica de la ecuación (19.17), la serie de Fourier se expresa también 
en términos de funciones exponenciales como sigue (véase el cuadro 19.2 y el apéndice A) 


mo= Y, cet 
== 
donde ¡=J=1 y 
T/2 


- 1 —ik0yt 
== t “ dt 
Ce T ae (De 


(19.21) 


(19.22) 


Esta fórmula alternativa tendrá utilidad a lo largo de lo que resta del capítulo. 


Cuadro 19.2 Forma compleja de las series de Fourier 


La forma trigonométrica de la serie de Fourier continua es 


FO=a,+ y [a, cos(k0w,£) + b, sen(ko,t)] 


k=1 


(C19.2.1) 


A partir de la identidad de Euler, el seno y el coseno se expresan en 
forma exponencial como 


senx == (C19.2.2) 
21 
ee 
COS x= > (C19.2.3) 


las cuales se sustituyen en la ecuación (C19.2.1) para dar 


FO0=a,+ yy sá a, —1b, q po +1b, ) 
El 2 2 


(C19.2.4) 
ya que 1/¡ =—i. Podemos definir un conjunto de constantes 
Co A 
-  a,—ib, 
ko 2 
ss a, ib,  a,+ib, 
Cs == ——— 9 
2 2 (C19.2.5) 


donde, debido a las propiedades de simetría del coseno y del seno, 
a, = 4, y b;=-—b_,. La ecuación (C19.2.4) puede, por lo tanto, reex- 
presarse como 


- ik ik 
f0=0 + ) e + > cea 
k=0 k=1 


0) 


fu = y Teno + S Ea 
k=0 k=1 


Para simplificar aún más, en lugar de sumar la segunda serie desde 
1 hasta ee, se realiza la suma de —1 a co, 


fO a > 50 +) Eeto 
k=0 


k=-1 


p0= Y 5er 


k=-xw 


(C19.2.6) 


donde la sumatoria incluye un término para k =0. 
Para evaluar las €,, las ecuaciones (19.18) y (19.19) se sustituyen 
en la ecuación (C19.2.5) para obtener 


1 (72 1 (72 
é,= F() cos(ko,t) diz! y (1) sen(ko,t) dt 


=T/R2 


Mediante las ecuaciones (C19.2.2) y (C19.2.3) y simplificando se 
obtiene 


mi 1 TR 7 
Es | fe" dr (C19.2.7) 
TJ 112 


Por lo tanto, las ecuaciones (C19.2.6) y (C19.2.7) son las versiones 
complejas de las ecuaciones (19.17) a (19.20). Observe que el apén- 
dice A incluye un resumen de las interrelaciones entre todas las 
formas de la serie de Fourier que se presentan en este capítulo. 
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19.3 DOMINIOS DE LA FRECUENCIA Y DEL TIEMPO 


Hasta aquí, nuestro análisis de la aproximación de Fourier se ha limitado al dominio del tiempo. 
Esto se debe a que para la mayoría de nosotros resulta fácil conceptualizar el comportamiento de 
una función en esta dimensión. Aunque no sea muy familiar, el dominio de la frecuencia ofrece una 
perspectiva alternativa para caracterizar el comportamiento de funciones oscilantes. 

Así, justo como se grafica la amplitud contra tiempo, de igual manera se grafica contra la fre- 
cuencia. Ambos tipos de expresión se ilustran en la figura 19.7a, donde se dibuja una gráfica en tres 
dimensiones de una función sinusoidal, 


fO=C, co + z) 


En esta gráfica, la magnitud o la amplitud de la curva, f(£), es la variable dependiente; y las variables 
independientes son el tiempo 1 y la frecuencia f= W//27. Así, los ejes de la amplitud y del tiempo 
forman un plano de tiempo, y los ejes amplitud y frecuencia, un plano de frecuencia. Por lo tanto, 
la sinusoide se concibe como si existiera a una distancia 1/7 hacia afuera y a lo largo del eje de la 
frecuencia, y corriendo paralela a los ejes del tiempo. En consecuencia, cuando se habla acerca del 
comportamiento de la sinusoide en el dominio del tiempo, significa la proyección de la curva en el 
plano del tiempo (figura 19.75). De manera similar, el comportamiento en el dominio de la frecuen- 
cia es tan sólo su proyección en el plano de la frecuencia. 
Como se observa en la figura 19.7c, esta proyec- 
ción es una medida de la amplitud positiva máxima de 
la sinusoide C,. La oscilación completa de pico a pico 
es innecesaria debido a la simetría. Junto con la ubi- 
cación 1/T a lo largo del eje de la frecuencia, la figura 
19.7c define ahora la amplitud y frecuencia de la si- 
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nusoide. Esta información es suficiente para reprodu- 
cir la forma y el tamaño de la curva en el dominio del 
tiempo. Sin embargo, se requiere un parámetro más, 
el ángulo de fase, para ubicar la curva en relación con 
t = 0. En consecuencia, se debe incluir también un 
diagrama de fase, como el que se muestra en la figura 
19.7d. El ángulo de fase se determina como la distan- 
cia (en radianes) desde cero al punto donde se presen- 
ta el pico positivo. Si el pico se presenta después del 
cero, se dice que está retrasada (recuerde nuestro aná- 
lisis de retrasos y adelantos de la sección 19.1) y, por 
convención, al ángulo de fase se le antepone signo 
negativo. En forma opuesta, con un pico antes de cero 
se dice que está adelantada y el ángulo de fase es po- 
sitivo. Así, en la figura 19.7, el pico está antes del cero 
y el ángulo de fase se grafica como +75/2. En la figu- 
ra 19.8 se ilustran otras posibilidades. 


Amplitud 


Se puede observar ahora que las figuras 19.7c y 
19.74 proporcionan una forma alternativa de presentar > mi E — 
o resumir las características de la sinusoide de la figu- rt 
ra 19.7a. Se hace referencia a ellas como espectros de c) 
línea. Se acepta que para una sola sinusoide estas líneas 
no son muy interesantes. Sin embargo, cuando se 
aplican a una situación más complicada, digamos, una 


Figura 19.7 


del ejemplo 19.2. 


YT 


d) 


a) Una ilustración de cómo se representa una sinusoide en los domi- 
serie de Fourier, se revela su poder y su valor. Por nios de la frecuencia y del tiempo. Se reproduce la proyección en el 
ejemplo, la figura 19.9 muestra el espectro de amplitud tiempo en b); mientras que la proyección de amplitud-frecuencia se 
y el espectro de fase para la función de onda cuadrada reproduce en c). La proyección de fase-frecuencia se muestra en d). 


420 Capítulo 19 Aproximación de Fourier 


Tales espectros ofrecen información que no aparece en el dominio del tiempo. Esto se puede ver 
al comparar las figuras 19.6 y 19.9. La figura 19.6 presenta dos perspectivas alternativas en el dominio 
del tiempo. La primera, la onda cuadrada original, no nos indica nada acerca de las sinusoides que 
comprende. La alternativa consiste en desplegar estas sinusoides [es decir, (4/77) cos(wy£), -(4/377) 
cos(3041), (4/57) cos(S5wyt)], etc. Esta alternativa no proporciona una visualización adecuada de la 
estructura de estas armónicas. Al contrario, las figuras 19.94 y 19.9b ofrecen una representación 
gráfica de esta estructura. Como tal, el espectro de línea representa “huellas dactilares” que nos pue- 
den ayudar a caracterizar y entender una forma de onda complicada. En particular ellos son valiosos 
en casos no idealizados donde algunas veces nos permiten discernir una estructura, mientras que de 
otra manera obtendríamos sólo señales oscuras. En la siguiente sección se describirá la transformada 
de Fourier que nos permitirá extender tal análisis a ondas de forma no periódica. 
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19.4 INTEGRAL Y TRANSFORMADA DE FOURIER 


Aunque la serie de Fourier es una herramienta útil para investigar el espectro de una función perió- 
dica, existen muchas formas de onda que no se autorrepiten de manera regular. Por ejemplo, un re- 
lámpago ocurre sólo una vez (o al menos pasará mucho tiempo para que ocurra de nuevo); pero 
causará interferencia en los receptores que están operando en un amplio rango de frecuencias (por 
ejemplo, en televisores, radios, receptores de onda corta, etc.). Tal evidencia sugiere que una señal 
no recurrente como la producida por un relámpago exhibe un espectro de frecuencia continuo. Ya 
que fenómenos como éstos son de gran interés para los ingenieros, una alternativa a la serie de Fourier 
sería valiosa para analizar dichas formas de onda no periódicas. 

La integral de Fourier es la principal herramienta para este propósito. Se puede obtener de la 
forma exponencial de la serie de Fourier 


f()= y E eto (19.23) 
k=—o0 
donde 
E 1 (72 y 
4 fume * di (19.24) 
-T/N2 


donde wd, =21./T y k=0, 1, 2,... 

La transición de una función periódica a una no periódica se efectúa al permitir que el periodo 
tienda al infinito. En otras palabras, conforme T'se vuelve infinito, la función nunca se repite y, de 
esta forma, se vuelve no periódica. Si se permite que ocurra esto, se puede demostrar (por ejemplo, 
Van Valkenburg, 1974; Hayt y Kemmerly, 1986) que la serie de Fourier se reduce a 


JN ESO i 
fo==—| Fio,e*" do, (19.25) 
27 -> 
y los coeficientes se convierten en una función continua de la variable frecuencia (, teniéndose que 
F(i0)=| fm dt (19.26) 


La función F(i0w./), definida por la ecuación (19.26), se llama integral de Fourier de f(t). Enton- 
ces, las ecuaciones (19.25) y (19.26) se conocen como el par de transformadas de Fourier. Así, 
además de llamarse integral de Fourier, F(iw/¿) también se denomina transformada de Fourier de 
F(0). De igual manera, f(£), como se define en la ecuación (19.25), se conoce como transformada 
inversa de Fourier de F(iWy). Así, el par nos permite transformar entre uno y otro de los dominios 
de la frecuencia y del tiempo para una señal no periódica. 

La diferencia entre la serie de Fourier y la transformada de Fourier ahora será clara. La princi- 
pal diferencia radica en que cada una se aplica a un tipo diferente de funciones (las series a formas 
de onda periódicas y la transformada a las no periódicas). Además de esta diferencia principal, los 
dos procedimientos difieren en cómo se mueven entre los dominios de la frecuencia y del tiempo. La 
serie de Fourier convierte una función continua y periódica en el dominio del tiempo, a magnitudes de 
frecuencia discretas en el dominio de la frecuencia. Al contrario, la transformada de Fourier convierte 
una función continua en el dominio del tiempo en una función continua en el dominio de la frecuencia. 
De esta manera, el espectro de frecuencia discreto generado por la serie de Fourier es análogo a un 
espectro de frecuencia continuo generado por la transformada de Fourier. 

El paso de un espectro continuo en uno discreto se puede ilustrar gráficamente. En la figura 
19.10a, se observa el tren de pulsos de ondas rectangulares con amplitudes de pulsación iguales a la 
mitad del periodo, asociado con su correspondiente espectro discreto. Esta función es la misma que 
se investigó antes en el ejemplo 19.2, sólo que en este caso está corrida verticalmente. 

En la figura 19.10b, al duplicar el periodo en el tren de pulsos se tienen dos efectos sobre el 
espectro. Primero, se agregan dos líneas de frecuencia a cada lado de las componentes originales. 
Segundo, se reducen las amplitudes de las componentes. 
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Figura 19.10 


Ilustración de cómo el espectro de 
frecuencia discreta de una serie de 


de Fourier c) conforme el periodo 
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Conforme el periodo se aproxima al infinito, dichos efectos generan líneas espectrales cada vez 
más comprimidas, hasta que el espacio entre las líneas tiende a cero. En el límite, las series conver- 
gen a la integral de Fourier continua, como se muestra en la figura 19.10c. 

Ahora que se ha presentado una forma para analizar una señal no periódica, veremos el paso 
final en nuestro desarrollo. En la siguiente sección analizaremos el hecho de que una señal rara vez 
está caracterizada como una función continua que se necesita para implementar la ecuación (19.26). 
En lugar de esto, los datos invariablemente están en forma discreta. Ahora se mostrará cómo calcu- 
lar la transformada de Fourier a partir de mediciones discretas. 


19.5 TRANSFORMADA DISCRETA DE FOURIER (TDF) 


En ingeniería, las funciones en general se representan por conjuntos finitos de valores discretos. Es 
decir, los datos con frecuencia se obtienen de, o convierten a, una forma discreta. Como se indica 
en la figura 19.11, se puede dividir un intervalo de O aten N subintervalos de igual tamaño Af = T/N. 
El subíndice n se emplea para designar los tiempos discretos a los cuales se toman las muestras. Así, 


f, designa un valor de la función continua f(t) tomado en 1,,. 


Observe que los puntos asociados con datos se especifican en n=0, 1, 2,..., N— 1. No hay un valor 
en n=N. (Véase Ramírez, 1985, para la razón de la exclusión de fy.) 
Para el sistema de la figura 19.11 se escribe la transformada discreta de Fourier como 


N-1 
E =D fet parak=0aN-1 (19.27) 


n=0 


y la transformada inversa de Fourier como 
Ec“ paran=0aN-1 (19.28) 


donde (y = 277 /N. 


Las ecuaciones (19.27) y (19.28) representan las análogas discretas de las ecuaciones (19.26) y 
(19.25), respectivamente. Como tales, ellas se emplean para calcular tanto la transformada directa 
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se aproxima al infinito. 
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como la inversa de Fourier, para datos discretos. Aunque es 
posible realizar tales cálculos a mano, son bastante laboriosos. 
Como lo expresa la ecuación (19,27), la TDF requiere N? ope- 
raciones complejas. Así, es necesario desarrollar un algoritmo 
computacional para implementar la TDF. 


FOA 


Algoritmo computacional para la TDF Observe que el 
factor 1/N en la ecuación (19.28) es sólo un factor de escala que 
se puede incluir tanto en la ecuación (19.27) como en la (19.28), 
pero no en ambas. En nuestro algoritmo computacional, lo in- 
cluiremos en la ecuación (19.27) para que el primer coeficiente 
F, (que es el análogo del coeficiente continuo a) sea igual a la 
media aritmética de las muestras. También, usaremos la iden- 
tidad de Euler para implementar un algoritmo con lenguajes NN 
que no contengan datos de variables complejas, 


tia — +7 
e cos a Ei sen a Figura 19.11 


y después volver a expresar las ecuaciones (19.27) y (19.28) Los puntos muestrales de la serie discreta de Fourier. 


como 
N 
1 ' 
E,=--Y [f, cos(koyn)= if, sen(koyn)] (19.29) 
N n=0 
y 
N-1 
fe = [F, cos(k0,n) +iF, sen(ko,n)] (19.30) 
k=0 


El pseudocódigo para implementar la ecuación (19.29) se muestra en la figura 19.12. Este algo- 
ritmo se puede desarrollar como un programa computacional para calcular la TDF. Los resultados 
de tal programa se tienen en la figura 19.13 para el análisis de una función coseno. 


DOFOR k= 0, N - 1 
DOFOR n= 0, N- 1 
angle = kwon 
real, = real, + f, cosíangle)/N 
imaginary, = imaginary, - f, sintangle)/N Figura 19.12 


END DO Pseudocódigo para el cálculo de la TDF 
END DO 
INDICE f (€) REAL IMAGINARIA 

10) 1.000 0.000 0.000 

ED 0.707 0.000 0.000 

2 0.000 0.500 0.000 

3 -0.707 0.000 0.000 

4 -1.000 0.000 0.000 S 

5 =0.707 0.000 0.000 Figura 19.13 

6 0.000 0.000 0.000 Resultados obtenidos 
7 0.707 0.000 0.000 con un programa ba- 
8 1.000 0.000 0.000 sado en el algoritmo 
9 0.707 0.000 0.000 de la figura 19.12 para 
10 0.000 0.000 0.000 la TDF con los datos 
11 -0.707 0.000 0.000 generados por una 
12 -1.000 0.000 0.000 función coseno f(t) = 
13 -0.707 0.000 0.000 cos[271(12.5)1] en 32 
14 0.000 0.500 0.000 puntos con Af=0.01 s. 
LS 0.707 0.000 0.000 
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19.6 TRANSFORMADA RÁPIDA DE FOURIER (TRF) 


Aunque el algoritmo descrito en la sección anterior calcula de manera adecuada la TDF, es compu- 
tacionalmente laborioso debido a que se requieren N? operaciones. En consecuencia, aun con mues- 
tras de un tamaño moderado, la determinación directa de la TDF llega a consumir mucho tiempo. 

La transformada rápida de Fourier, o TRF, es un algoritmo que se desarrolló para calcular la TDF 
en una forma extremadamente económica. Su velocidad proviene del hecho de que utiliza los 
resultados de cálculos previos para reducir el número de operaciones. En particular, aprovecha 
la periodicidad y simetría de las funciones trigonométricas para calcular la transformada con aproxi- 
madamente N log, N operaciones (véase figura 19.14). Así, para N = 50 muestras, la TRF es cerca 
de 10 veces más rápida que la TDF estándar. Para N= 1000, es alrededor de 100 veces más rápida. 

El primer algoritmo para la TRF fue desarrollado por Gauss a principios del siglo xIx (Heideman 
y cols., 1984). Otras contribuciones importantes fueron hechas por Runge, Danielson, Lanczos y otros 
a comienzos del siglo xx. Sin embargo, como calcular manualmente las transformadas discretas to- 
maba días o semanas, no atraían mucho el interés antes del desarrollo de la moderna computadora 
digital. 

En 1965, J. W. Cooley y J. W. Tukey publicaron un artículo clave, en el cual se propuso un al- 
goritmo para el cálculo de la TRF. Dicho esquema, similar a aquel de Gauss y de otros investigado- 
res anteriores, se conoce como algoritmo de Cooley-Tukey. En la actualidad, existen otros 
procedimientos que son adaptaciones de este método. 

La idea básica detrás de cada uno de estos algoritmos es que una TDF de longitud N se descom- 
pone, o “particiona” sucesivamente en TDF más pequeñas. Hay una variedad de formas diferentes de 
aplicar este principio. Por ejemplo, el algoritmo de Cooley-Tukey usa las llamadas técnicas de parti- 
ción en el tiempo. En esta sección se describirá un procedimiento alternativo llamado algoritmo de 
Sande-Tukey. Este método pertenece a otra clase de algoritmos que se denominan técnicas de partición 
en frecuencia. La distinción entre las dos clases se analizará tras desarrollar el método. 


19.6.1 Algoritmo de Sande-Tukey 
En el presente caso, se supondrá que N es una potencia entera de 2, 


N=2% (19.31) 


resultante. Ahora, recuerde que la TDF se puede representar de manera general 


Ú 
, 
E donde M es un entero. Se introduce esta restricción para simplificar el algoritmo 
, 
1 
2 como 


N-1 


E = feo YM parak=0aN-1 (19.32) 


k=0 


donde 277/N = (Ww,. La ecuación (19.32) se expresa también como 


donde W es una función ponderada de valor complejo definida como 


W= e¡QuIN) (19.33) 


Suponga ahora que la muestra se divide a la mitad y la ecuación (19.32) se 


Muestras expresa en términos de los primeros y últimos N/2 puntos: 


(N/2)-1 


N-1 
== -¡Q1/N)kn -¡Q/N kn 
F, A $,e + b f,€ 


Gráfica del número de operaciones EA MIO 
contra tamaño de la muestra de la TDF 


estándar y la TRE. 


donde k =0, 1, 2,.... N— 1. Se crea una nueva variable, m = n — N/2, para que los 
límites de la segunda sumatoria sean consistentes con la primera, 
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(N/2)-1 (N/2)-1 
A -¡(27/N)n —i(27/N )k(m+N/2) 
Eos Í,2 + > TS 
n=0 m=0 
0) 
/2)-1 
ik y —¡2mknl 

y de cea Ai (19.34) 

n=0 


Ahora, advierta que el factor e-7*= (-1)*. De esta forma, para puntos pares es igual a 1 y para 
los impares es igual a —1. Por lo tanto, el siguiente paso en el método consiste en separar la ecuación 
(19.34) de acuerdo con valores pares o impares de k. Para los valores pares, 


N/2)-1 (N/2)-1 


MEA =12x(2k)n/N -¡21kn/(N/2) 
EY e 2 (Lt Fucnnde 
n=0 


y para los valores impares, 


(N/2)-1 


-121(2k+1)n/N 
Par = y O 
n=0 


(N/2)-1 


= ys WA E 


n=0 


para k=0, 1,2,..., (V/2) — 1. 
Estas ecuaciones se expresan también en términos de la ecuación (19.33). Para los valores pares, 


(N/2)-1 


tn WA 


n=0 


y para los valores impares, 


(N/2)-1 


Pa DINA 


n=0 


Ahora, realizaremos una observación clave: esas expresiones pares e impares se pueden inter- 
pretar como si fueran iguales a las transformadas secuenciales de longitud (V/2) 


En = La + nn (19.35) 


h= a fann)W" paran=0, 1,2,..., (VW2)-1 (19.36) 
De esta manera, en forma directa resulta que 


Por = Gi ex 
para k=0,1,2,...,(N/2)-1 
Porn =H, 

En otras palabras, se reemplazó un cálculo de N puntos por dos cálculos de (N/2) puntos. Pues- 
to que cada uno de los últimos requiere aproximadamente (WV/2)? multiplicaciones y sumas comple- 
jas, el procedimiento permite un ahorro de un factor de 2 (es decir, N? contra 2(N/2)? = N?/2). 

El esquema se ilustra en la figura 19.15 para N = 8. La TDF se calcula formando primero la se- 
cuencia g” y h” y calculando después las N/2 TDF para obtener las transformadas numeradas pares e 
impares. Algunas veces los pesos W” se llaman factores de giro. 

Ahora es claro que este procedimiento de “divide y vencerás” se puede repetir en la segunda 
etapa. Así, calculamos la TDF de N/4 puntos de las cuatro secuencias de N/4 compuestas de los 
primeros y últimos N/4 puntos de las ecuaciones (19.35) y (19.36). 
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FO) (0) F(0) 
00) 20) FO) 
(N/2)-puntos 
FO) 30) TDF F(4) 
FG) 8(3) F(6) 
FA) h(0) FM) 
Figura 19.15 5) ON) FG) 
Diagrama de flujo de la primera (N/2)-puntos 
etapa en una descomposición por $6) h(2) TDF F(S) 
partición en frecuencia de una TDF q AA 
con N puntos en dos TDF con (N/2) $0) 3) E() 
puntos para N = 8. A] WAS 


Se continúa la estrategia hasta su inevitable conclusión, cuando N/2 de TDF de dos puntos se 
hayan calculado (figura 19.16). El número total de cálculos para el cálculo completo es del orden de 
Nlog, N. La diferencia entre este nivel de esfuerzo y el de la TDF estándar (figura 19.14) ilustra por 
qué es tan importante la TRE. 


Algoritmo computacional Es relativamente sencillo expresar la figura 19.16 como un algoritmo. 
Como en el caso del algoritmo para la TDF de la figura 19.12, se usará la identidad de Euler, 
ed =cos a+ isena 


para implementar el algoritmo en lenguajes que no emplean en forma explícita variables complejas. 

Una inspección cercana a la figura 19.16 indica que su molécula computacional fundamental es 
la llamada red mariposa, ilustrada en la figura 19.17a. El pseudocódigo para implementar una de 
esas moléculas se muestra en la figura 19.17b. 


FO) + 


Figura 19.16 

Diagrama de flujo de la descom- 
posición completa por partición en 
frecuencia de una TDF con ocho 
puntos. 


El pseudocódigo para la TRF se da en la figura 19.18. La primera parte consiste, en esencia, en 
tres ciclos anidados para implementar el cuerpo computacional de la figura 19.16. Observe que los 
datos reales se guardan originalmente en el arreglo x. También observe que el ciclo exterior pasa a 
través de las M etapas [recuerde la ecuación (19.31)] del diagrama de flujo. 
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+ 
FO) F(0) temporal = real (0) + real (1) 
pa real (1) = real (0) — real (1) 
real (0) = temporal 
temporal = imaginario (0) + imaginario (1) Figura 19.17 
+ imaginario (1) = imaginario (0) — imaginario (1) a) Una red mariposa que representa el 
0) 0 F(1) ¡imaginario (0) = temporal cálculo fundamental de la figura 19.16. 
a) b) b) Pseudocódigo para implementar a). 
a) b) 
m= LOG(N)/LOG(2) j=0 
N2 = N DOFOR 1 = 0, N- 2 
DOFOR k = 1, m IF (1< J) THEN 
N1 = N2 XE= Xj 
N2 = N2/2 Xy = Xi 
angle = 0 Xi; = Xt 
arg = 2x1 /N1 yt= y; 
DOFOR j= 0, N2 - 1 Ne y 
c= cosítangle) Yi = yt 
s = -sintangle) END IF 
DOFOR Ti = j, N - 1, N] k= N/2 
kk = 71+oN2 DO 
xt= x(1) -= x(kk) IF (k 2 j+ 1) EXIT 
X(1) = x(1) + x(kk) J=j-k Figura 19.18 
Ye = y (1) - y(kk) k= k/2 Pseudocódigo para implementar 
YyY(0)= y(1)+ y(kk) END DO una TRF con partición en frecuencia. 
X(kk) = xt * 0 -yt*s =ji>+*«k Observe que el pseudocódigo está 
Y(kk) = yt *C0+ xt *s END DO compuesto por dos partes: a) la TRF 
END DO DOFOR ¡= 0, N- 1 en sí y b) una rutina de inversión de 
angle = (j + 1) * arg Xx(1) = x(7)/N bits para ordenar los coeficientes 
END DO y(1) = y(T)/N de Fourier resultantes. 
END DO END DO 


Después de que se ejecuta esta primera parte, se habrán calculado las TDF, pero en desorden 
(véase el lado derecho de la figura 19.16). Es posible ordenar esos coeficientes de Fourier mediante 
un procedimiento llamado de inversión del bit. Si los subíndices O al 7 se expresan en forma binaria, 
se obtiene el orden correcto al invertir esos bits (figura 19.19). La segunda parte del algoritmo rea- 
liza este procedimiento. 


19.6.2 Algoritmo de Cooley-Tukey 


La figura 19.20 muestra una red de flujo para implementar el algoritmo de Cooley-Tukey. Para este 
caso, la muestra se divide inicialmente en puntos numerados pares e impares, y los resultados fina- 
les están en el orden correcto. 

Este procedimiento se llama una partición en el tiempo. Es el inverso del algoritmo de Sande- 
Tukey descrito en la sección anterior. Aunque las dos clases de métodos difieren en organización, 
ambos presentan las N log, N operaciones que son la fortaleza del procedimiento de la TRF. 


19.7 EL ESPECTRO DE POTENCIA 


La TRF tiene diversas aplicaciones en ingeniería que van desde el análisis de vibración de estructu- 
ras y mecanismos, hasta el procesamiento de señales. Como se describió antes, el espectro de am- 
plitud y fase proporciona un medio para entender la estructura de señales bastante aleatorias. De 
manera similar, un análisis útil llamado espectro de potencia se puede desarrollar a partir de la 
transformada de Fourier. 
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En orden de bits Resultado 
En desorden En desorden invertidos final 
(decimal) (binario) (binario) (decimal) 
F(O) F(O00) F(000) F(O) 
F(4) F(100) F(001) F(1) 
F(2) F(010) F(010) F(2) 
F(6) > F(110) > F(011) > F(3) 
á F(1) F(001) F(100) F(4) 
PIQUES Oca F(5) E(101) F(101) F(5) 
Ilustración del proceso F(3) (011) E(110) F(6) 
de inversión de bits. F(7) F(1 1 1) F (1 1 1) F(7) 
FO) F(0) 
O ) 0 > 
FA) yo F() 
$ > 
10) wo <p> F() 
> Las > 
AS AS XA de 
7 RR 
. 0 E 
Figura 19.20 : SN > ; E 
Diagrama de flujo de una TRF con ¡ A y de 


tició lti > de ú 
partición en el tiempo para una XD) ó A z FO) 
TDF de 8 puntos. d o pe e is e 


Como su nombre indica, el espectro de potencia se obtiene del análisis de la potencia de salida 
en sistemas eléctricos. En términos matemáticos, la potencia de una señal periódica en el dominio 
del tiempo se define como 


$ Ip, 4 
e 2 19.37 
FL, (0d edi 


Ahora, otra forma de entender esta información es expresándola en el dominio de la frecuencia y 

calculando la potencia asociada a cada componente de frecuencia. Después esta información se 

despliega como un espectro de potencia, es decir, una gráfica de la potencia contra la frecuencia. 
Si la serie de Fourier para f(£) es 


f4)= yA Fetoo (19.38) 


k=-oo 


se satisface la siguiente relación (véase Gabel y Roberts, 1987, para más detalles): 


1 TI z y $5 » 
ld (0 di= Y, [E (19.39) 


k=-00 


De esta forma, la potencia en f(£) se determina al sumar los cuadrados de los coeficientes de Fourier, 
es decir, las potencias asociadas con los componentes de frecuencia individual. 

Ahora, recuerde que, en esta representación, la armónica real simple consta de ambos compo- 
nentes de frecuencia en +k0Wp. También sabemos que los coeficientes positivos y negativos son 
iguales. Por lo tanto, la potencia en f,(t), la k-ésima armónica real de f(£), es 
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pw=21F,/ (19.40) 


El espectro de potencia es la gráfica de p, en función de la frecuencia kW. Dedicaremos la sección 
20.3 a una aplicación en ingeniería que emplea la TRF y el espectro de potencia obtenido por medio 
de un paquete de software. 


Información adicional Lo anterior ha sido una breve introducción a la aproximación de Fourier 
y a la TRF. Se puede encontrar información adicional sobre la primera en Van Valkenburg (1974), 
Chirlian (1969), y Hayt y Kemmerly (1986). Las referencias sobre la TRF se encuentran en Davis y 
Rabinowitz (1975); Cooley, Lewis y Welch (1977), y Brigham (1974). Buenas introducciones a am- 
bos temas se encuentran en Ramírez (1985), Oppenheim y Schafer (1975), Gabel y Roberts (1987). 


19.8 AJUSTE DE CURVAS CON PAQUETES DE SOFTWARE 


Los paquetes de software tienen grandes posibilidades para el ajuste de curvas. En esta sección da- 
remos una muestra de las más usuales. 


19.8.1 Excel 


En el presente contexto, la aplicación más útil de Excel es en el análisis de regresión y, en menor 
extensión, en la interpolación polinomial. Además de algunas funciones incorporadas (véase la tabla 
19.1), existen dos formas principales en las que se puede emplear esta posibilidad: el comando Tren- 
dline y el Data Analysis Toolpack (paquete de herramientas para el análisis de datos). 


Tabla 19.1 Funciones de Excel interconstruidas relacionadas con el ajuste de datos por regresión. 


Función Descripción Función Descripción 


429 


FORECAST Da un valor junto con una tendencia lineal LOGEST Da los parámetros de una tendencia exponencial 
GROWTH Da valores junto con una tendencia exponencial SLOPE Da la pendiente de la recta de regresión lineal 


INTERCEPT Da la intersección de la recta de regresión lineal TREND Da valores junto con una tendencia lineal 


LINEST Da los parámetros de una tendencia lineal 


El comando Trendline (menú Insert) Este comando permite agregar varios modelos de tenden- 
cia a una gráfica. Tales modelos comprenden ajustes lineales, polinomiales, logarítmicos, exponencia- 
les, de potencia y de promedio móviles. El siguiente ejemplo ilustra cómo utilizar el comando 
Trendline. 


EJEMPLO 19.3 Uso del comando Trendline de Excel 


Planteamiento del problema Usted habrá notado que varios de los ajustes que tiene Trendline 
fueron analizados ya en el capítulo 17 (por ejemplo, lineal, polinomial, exponencial y de potencia). 
Una posibilidad adicional es el modelo logarítmico 


y = ay + a, log x 


Ajuste los siguientes datos con este modelo usando el comando Trendline de Excel: 


x |05 1 1.5 2 2.5 3 3:5 4 45 5 5.5 


y | 0.53 0.69 1.5 ds 2 2.06 2.28 2:23 2.73 2.42 2.79 


Solución Para usar el comando Trendline, se debe crear una gráfica que relacione una serie de 
variables dependientes y de variables independientes. Para el caso actual, se crea primero una grá- 
fica XY de los datos. 
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En seguida, se puede seleccionar la gráfica 


Y (haciendo clic sobre ella) y la serie (posicionando 
la flecha del mouse en uno de los valores y hacien- 
2 do clic derecho). Aparecerá un menú donde usted 
2 MS a puede seleccionar Add Trendline (“Agregar línea 
1 1? = 0.9444 A 

de tendencia”). 
0 | | | | | lx Entonces se abre una caja para formatear la 
0 2 4 6 línea de tendencia (Format Trendline), donde puede 
seleccionar el Trend/RegressionType (tipo de ten- 
Figura 19.21 dencia/regresión) como Logarithmic (logarítmico). 
Ajuste de un modelo logarítmico a los datos del Además, seleccione Display Equation on chart y 
ejemplo 19.3. Display R-squared value on chart. Cuando se 


cierre la caja, aparece la curva de ajuste resultante 
junto con r? como se muestra en la figura 19.21. 
El comando Trendline proporciona una manera fácil para ajustar a los datos varios modelos que 
se usan comúnmente. Además, la opción Polinomial se incluye también para que se pueda usar la 
interpolación polinomial. Sin embargo, como su contenido estadístico está limitado a »?, esto signi- 
fica que no permite obtener gráficas de inferencias estadísticas respecto al ajuste del modelo. El 
paquete de herramientas para el análisis de datos (Data Analysis Toolpack) que se describirá a con- 
tinuación ofrece una excelente alternativa en casos donde son necesarias las inferencias. 


El paquete de herramientas para el análisis de datos (Data Analysis Toolpack) Este 
paquete adicional de Excel tiene amplias posibilidades para el ajuste de curvas por mínimos cuadra- 
dos lineales generales. Como se describió en la sección 17.4, tales modelos son de la forma general 


Y = AgZo + 0121 + 092) +" + OZ + € (17.23) 


donde Zo, Z1»-.., 2, SON M+ 1 funciones diferentes. El siguiente ejemplo ilustra cómo tales modelos 
se pueden ajustar con Excel. 


EJEMPLO 19.4 Uso del paquete de herramientas para el análisis de datos 
(Data Analysis Toolpack) de Excel 


Planteamiento del problema Los siguientes datos son la pendiente, el radio hidráulico y la 
velocidad del agua que fluye en un canal: 


S, m/m 0.0002 0.0002 0.0005 0.0005 0.001 0.001 
R,m 0.2 0.5 0.2 0.5 0.2 0.5 
U, m/s 0.25 0.5 0.4 0.75 0.5 1 


Se tienen razones teóricas para creer que los datos se pueden ajustar a un modelo de potencias de la 
forma 


U=as er? 


donde «, O y p son coeficientes obtenidos de manera empírica. Existen razones teóricas para creer 
que O y p serán aproximadamente de 0.5 y 0.667, respectivamente. Ajuste estos datos con Excel y 
determine si los valores estimados con la regresión contradicen los valores esperados de los coefi- 
cientes del modelo. 


Solución En el modelo de potencias se aplican primero logaritmos para convertirlo a la forma 
lineal de la ecuación (17.23), 
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U=lo0g a +0 log S +p log R 


Se puede desarrollar una hoja de cálculo en Excel, tanto con los datos originales como con sus res- 
pectivos logaritmos, como en la siguiente tabla: 


A a | E: F 
A Ss R log (R) log (U) 
2 0.0002 0.2 -0.69897  -0.60206 
3 | 0.0002 0.5 0.5  -3.69897% -0.30103  -0.30103 
4 | 0.0005 0.2 0.4  -3.30103 40.69897 -0.39794 
5 | 0.0005 0.5 0.75  -3.30103 -Y.30103  -0.12494 
6. 0.001 0.2 0.5 -3 -—0%9897 -0.30103 
Ma 0.001 0.5 1 -3  -0.3p103 0 


=log(A2) 


Como se indica, una manera eficiente para generar los logaritmos es tecleando la fórmula para cal- 
cular el primer log(S). Después se copia esta fórmula a la derecha y se baja para generar los otros 
logaritmos. 

Debido a su estatus como agregado a la versión de Excel disponible en el momento de la edición 
en inglés de este libro, algunas veces hay que cargar en Excel el paquete de herramientas para el 
análisis de datos. Para hacer esto, elija File, Options, Add-Ins, Manage Excel Add-ins. Luego marque 
la caja Analysis ToolPak. Entonces debe aparecer como instalado el ToolPak y un botón para acce- 
der a éste en su pestaña “Data”. 

Después de seleccionar Data Analysis del menú Data, aparecerá en pantalla un menú de Data 
Analysis que contiene un gran número de rutinas orientadas estadísticamente. Seleccione Regression 
y se desplegará un cuadro de diálogo que esperará que se le proporcione información sobre la regresión. 
Después de estar seguros que se ha seleccionado la instrucción por default New Worksheet Ply, dé F2:F7 
como el rango y y D2:E7 como el rango x, y seleccione OK. Se creará la siguiente hoja de cálculo: 


A B c D E F G 
1 RESUMEN DE RESULTADOS | ] 31 Te 1 

2 

3 Estadística de regresión 

4 ' Múltiple R 0.998353 

5  Rcuadrada 0.996708 

6 | Aj.de R cuadrada 0.994513 

7 Error estándar 0.015559 

8. Observaciones 6 

Ss 

10 ANOVA 

NAS. Y MS. 1 F | SignificanciaF | 

12 Regresión 2 0.219867  0.10993  454.1106 0.0001889 

13 Residual 3 0.000726 0.0024 

14. Total 5 0.220593 

15 

186. ——— Coeficientes  Erorestándar Estad.t  ValorP | Infal95% Sup.al95% 
“47 | Intersección [1522452 | 0.075932 20.05010 0.000271 12808009 17641028 
18  XVariable 1 0.433137 0.022189  19.52030  0.000294 0.362521 0.503752 
19  XVariable 2 0.732993 0.031924 2296038  0.000181  0.631395 0.834590 


De esta manera, el ajuste resultante es 
log U = 1.522 + 0.433 log S + 0.733 log R 
o tomando antilogaritmos, 


U= 33.3,50.433]p0.733 
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Observe que se generaron intervalos de confianza de 95% para los coeficientes. Así, hay 95% 
de probabilidad de que el verdadero exponente de la pendiente esté entre 0.363 y 0.504, y de que el 
verdadero coeficiente del radio hidráulico esté entre 0.631 y 0.835. De esta forma, el ajuste no con- 
tradice los exponentes teóricos. 


Finalmente, se debe observar que se puede usar la herramienta Solver de Excel para una regre- 
sión no lineal, minimizando de manera directa la suma de los cuadrados de los residuos entre una 
predicción del modelo no lineal y los datos. Dedicaremos la sección 20.1 a un ejemplo de cómo se 
realiza lo anterior. 


19.8.2 MATLAB 


Como se resume en la tabla 19.2, MATLAB tiene varias funciones preconstruidas que abarcan todas 
las capacidades que se describen en esta parte del libro. El siguiente ejemplo ilustra cómo usar al- 
gunas de ellas. 


Tabla 19.2 Algunas funciones de MATLAB para implementar interpolación, 
regresión, trazadores y TRF. 


Función Descripción 


polyfit Ajusta polinomios a datos 

interpl Interpolación 1-D (tabla 1-D) 
interp2 Interpolación 2-D (tabla 2-D) 

spline Interpolación de datos con splin cúbico 


fft Transformada discreta de Fourier 


EJEMPLO 19.5 Uso de MATLAB para el ajuste de curvas 


Planteamiento del problema Explore cómo se utiliza MATLAB para ajustar curvas a datos. 
Para ello, use la función seno para generar valores regularmente espaciados f(x) de O a 10. Utilice 
un tamaño de paso de 1, de tal forma que la caracterización resultante de la onda seno sea disper- 
sa (figura 19.22). Después, ajústela con interpolación a) lineal, b) polinomial de quinto grado 
y Cc) trazadora cúbica. 


Solución 
a) Los valores de las variables independientes y dependientes se introducen en vectores mediante 


>> x=0:10; 
YA >> y=sin(x); 
e e o E 
- 0 Se genera un nuevo vector más finamente espaciado con va- 
FP o lores de la variable independiente y se guarda en el vector xi, 
— o 
L >> xi=0:.25:10; 
E A A AS AA ad et 
A z O eS La función MATLAB interpl se usa después para generar 
E o valores de la variable dependiente yi para todos los valores 
E O xi usando interpolación lineal. Tanto los valores originales 
1 + o (x, y) como los valores interpolados linealmente se grafican 
juntos, como se muestra en la gráfica siguiente: 
Figura 19.22 >> yi=interpl(x,y,x1); 


Once puntos muestreados de una sinusoide. >> plot (x,y,'o',xi,yi) 
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b) A continuación, la función polyfit de MATLAB se emplea para generar los coeficientes de 
un ajuste polinomial de quinto grado a los datos dispersos originales, 


>> p=polyfit (x, y, 5) 
p= 
0.0008 -0.0290 0.3542 -1.6854 2.5860 -0.0915 


donde el vector p contiene los coeficientes polino- 
miales. Éstos, a su vez, se utilizan para generar un 
nuevo conjunto de valores yi, los cuales de nuevo 
pueden graficarse junto con la muestra original 
dispersa, me 


>> yi = polyval (p,x1i); of 
>> plot (x,y,'o'",xi,yi) 


El polinomio captura el comportamiento general 
que siguen los datos; aunque deja fuera a la ma- y 
yoría de los puntos. 

c) Finalmente, la función sp1ine de MATLAB 
puede servir para ajustar un trazador cúbico a los 
datos originales dispersos, en la forma de un nuevo 
conjunto de valores yi, los cuales nuevamente se 
grafican junto con la muestra original dispersa, 


>> yi=spline(x,y,x1); Ss 

>> plot (x,y,*0'",xi,yi) 02 

DA 

MATLAB también tiene excelentes capacidades e 

para realizar el análisis de Fourier. Se dedica la sección 15 
20.3 a un ejemplo de cómo hacerlo. NA —Á ———; 


MATLAB tiene dos funciones incorporadas para interpolación discreta bidimensional y tridi- 
mensional: interp2 e interp3. Como podría esperarse por sus nombres, estas funciones operan 
de modo similar a interpl1. Por ejemplo, una representación sencilla de la sintaxis de interp2 es 


zi = interp2(x, y, Z, X1, yi, 'method') 


donde x y y = matrices que contienen las coordenadas de los puntos en los que se dan los valores 
en la matriz z, zi = matriz que contiene los resultados de la interpolación evaluados en los puntos 
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en las matrices xi y yi, y method =el método que se desea. Observe que los métodos son idén- 
ticos a los que se usan por interpl; es decir, linear, nearest, spline y cubic. 

Igual que con interpl, si se omite el argumento method, entra forzosamente interpolación 
lineal. Por ejemplo, se puede usar interp2 para hacer la misma evaluación que en el ejemplo 18.11 
como 


>> x=[2 9]; 

>> y=[1 6]; 

>> z=[60 57.5;55 701; 

>> interp2(x,y,Z,5.25,4.8) 
ans = 


61.2143 


19.8.3 Mathcad 


Mathcad puede realizar una amplia variedad de tareas estadísticas, de ajuste de curvas y de suavi- 
zación de datos. Algunas de estas tareas son relativamente simples, como graficar histogramas y 
calcular resúmenes estadísticos de población como media, mediana, varianza, desviaciones estándar 
y coeficientes de correlación. Además, Mathcad contiene un número de funciones para realizar re- 
gresión. Las funciones slope e intercept devuelven como respuesta la pendiente y la intercepción de 
la línea de ajuste de regresión de mínimos cuadrados. La función regress se usa para regresión 
polinómica de grado n de un conjunto completo de datos. La función loess realiza regresión polinó- 
mica localizada sobre rangos parciales de los datos que usted puede especificar. La función interp 
se puede usar para obtener valores inmediatos de y de un ajuste de regresión para un punto x dado. 
Las funciones regress y loess pueden también realizar regresión polinómica multivariada. Mathcad 
también ofrece la función linfit que se emplea para modelar datos con una combinación lineal de 
funciones arbitrarias. Finalmente, la función genfit está disponible para casos en los que los coefi- 
cientes del modelo aparecen en forma arbitraria. En este caso, las ecuaciones no lineales más difí- 
ciles se deben resolver por iteración. 

Mathcad también tiene capacidades considerables para interpolación. Puede predecir valores 
intermedios conectando puntos de datos conocidos ya sea con líneas rectas (interpolación lineal), 
usando la función linterp, o con interpolación por trazador cúbico usando la función espline, pspli- 
ne o Ispline. Estas funciones de trazador permiten que usted pruebe diferentes maneras de manejar 
la interpolación en los puntos extremos de los datos. La función Ispline genera una curva de spline 
que es una línea recta en los puntos extremos. La función pspline genera una curva de trazador que 
es una parábola en los puntos extremos. La función espline genera una curva de trazador que es 
cúbica en los puntos finales. La función interp usa los resultados del ajuste de curva y entrega un 
valor interpolado de y dado un valor de x. Además, se puede realizar interpolación bidimensional 
cúbica de trazador mediante el paso de una superficie a través de una cuadrícula de puntos. 

Realicemos un ejemplo que muestra cómo se emplea Mathcad para realizar una interpolación 
de spline (figura 19.23). Los datos que incluiremos sólo son algunos puntos espaciados uniforme- 
mente, muestreados a partir de una curva sinusoidal. Después de generar esta información, el sím- 
bolo de la definición y la función Ispline se usan para calcular los coeficientes del trazador. Luego 
se desarrolla una función de interpolación, fija, con la función interp, con objeto de generar valores 
interpolados para valores específicos de x. Mathcad diseñó esta secuencia de operaciones de tal 
manera que no sea necesario recalcular los polinomios de interpolación cada vez que se desee una 
interpolación. Con las funciones en su sitio, usted puede interpolar en cualquier ubicación usando 
fit(x), como se muestra con x = 2.5. También puede usted construir una gráfica de los datos junto 
con el trazador interpolado como se muestra en la figura 19.23. 

Como otro ejemplo para demostrar algunas de las capacidades de Mathcad para ajuste de curvas, 
se usará la función fft para análisis de Fourier como en la figura 19.24. La primera línea usa el 
símbolo de definición para crear ¿ como un rango variable. En seguida se formula x, usando la función 
Mathcad rnd para impartir una componente aleatoria a la señal sinusoidal. La gráfica de la señal se 
puede colocar en la hoja de cálculo haciendo clic en la ubicación deseada. Esto pone una retícula roja 
en esa ubicación. Luego use el menú desplegable Insert/Graph/X-Y Plot para colocar una gráfica 
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Mi!Mathcad 


MÍ] File Edit View Irsert Format Tools Symbolis Window. Help 
SPLINE INTERPOLATION 


Enter vectors containing the x and y values: — Values for plot: 
i:=0..10 vx =1i vy, == sin(i) xx := 0,0.1..10 


Compute spline coefficients: 
vs; := Ispline(vx,vy) 


Set up interpolation function: 
fit(x) := interp(vs,vx,vy,x) 
Interpolate at specific value 
fit(2.5) = 0.596 


Figura 19.23 
Interpolación de trazador cúbico con 
Mathcad. 


vacía en la hoja de cálculo con espacios para introducir las expresiones que se van a graficar y para 
los rangos de los ejes x y y. Simplemente teclee x, en el espacio indicado en el eje y e ¡ para el eje x. 
Mathcad hace el resto para producir la primera gráfica que se muestra en la figura 19.24. Una vez que 
se ha creado la gráfica, usted puede usar el menú desplegable Format/Graph/X-Y Plot para variar el 
tipo de gráfica, cambiar el tipo de color, tipo y peso del trazo de la función, y agregar títulos, rótulos 
y otros atributos. Luego se define c como fft(x). Esta función entrega la transformada de Fourier de 
x. El resultado es un vector ce de coeficientes complejos que representan valores en el dominio de la 
frecuencia. Entonces se construye una gráfica de la magnitud de c, como se describe arriba. 


MiMathcad 


FAST FOURIER TRANSFORM 
Define a real signal in time: 


dre sli á 

i := 0..63 X¡ = sin k E +rnd (1) — 0.5 
Compute frt: 

c:= fft(x) j :=0..32 


Figura 19.24 
FFT (TRF) con Mathcad. 
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PROBLEMAS 
19.1 Los valores promedio de una función se determinan por medio 
de 
==. id 
7-22 


Emplee esta relación para verificar los resultados de la ecuación 
(19.13). 

19.2 Se ha tabulado la radiación solar en Tucson, Arizona, como 
sigue 


Tiempo, meses E F M A M J 

Radiación, W/m? 144 188 245 311 351 359 
Tiempo, meses J A S 0) N D 
Radiación, W/m? 308 287 260 211 159 131 


Suponga que cada mes tiene 30 días y ajuste una sinusoide a estos 
datos. Utilice la ecuación resultante para pronosticar la radiación a 
mediados de agosto. 

19.3 El pH en un reactor varía en formas sinusoidales durante el 
curso del día. Utilice regresión por mínimos cuadrados para ajustar 
la ecuación (19.11) a los datos siguientes. Use el ajuste para deter- 
minar la media, amplitud y tiempo del pH máximo. Note que el pe- 
riodo es de 24 h. 


Tiempo, h | 0 2 4 5 2 9 12 15 20 22 24 
pH 17.3 7 71 65 74 72 89 88 89 79 7 


19.4 Use una serie de Fourier continua para aproximar la onda 
diente de sierra que se observa en la figura P19.4. Elabore la gráfica 
de los tres primeros términos junto con la suma. 


= Y 


Figura P19.4 
Onda diente de sierra. 


19.5 Utilice una serie de Fourier continua para aproximar la forma 
de la onda que se ilustra en la figura P19.5. Grafique los tres prime- 
ros términos junto con la suma. 

19.6 Construya los espectros de línea de amplitud y fase para el 
problema 19.4. 

19.7 Construya los espectros de línea de amplitud y fase para el 
problema 19.5. 

19.8 Un rectificador de media onda se caracteriza por medio de 


cos 2f cos41 


1 1 
C, =| +7 sent 
T 2 37 157 
obre | 
357 


2 2 t 


Figura P19.5 
Onda triangular. 


donde C; es la amplitud de onda. Grafique los primeros cuatro tér- 
minos junto con la suma. 

19.9 Construya espectros de línea de amplitud y fase para el proble- 
ma 19.8. 

19.10 Desarrolle un programa amigable para la TDF con base en el 
algoritmo de la figura 19.12. Pruébelo con la replicación de la figura 
19.13. 

19.11 Use el programa del problema 19.10 para calcular una TDF 
para la onda triangular del problema 19.8. Muestre la onda de t=0 
a47T. Use los puntos de muestra 32, 64 y 128. Tome el tiempo de cada 
corrida y haga la gráfica de la ejecución versus N para verificar la 
figura 19.14. 

19.12 Desarrolle un programa amigable para la TRF con base en el 
algoritmo de la figura 19.18. Pruébelo con la duplicación de la figu- 
ra 19.13. 

19.13 Repita el problema 19.11 con el uso del software que desarro- 
lló en el problema 19.12. 

19.14 Un objeto está suspendido en un túnel de viento y se mide la 
fuerza para varios niveles de velocidad del viento. Los resultados se 
hallan tabulados a continuación. Use el comando de Excel Trendline 
para ajustar una ecuación de potencias a estos datos. Haga la gráfica 
de F versus v junto con la ecuación de potencias y r?. 


v, m/s 
F,N 


[10 20 30 40 50 60 70 80 
| 25 70 380 550 610 1220 830 1450 


19.15 Use el paquete de herramientas para el análisis de datos de 
Excel para desarrollar un polinomio de regresión para los datos si- 
guientes, para la concentración de oxígeno disuelto de agua dulce 
versus temperatura a nivel del mar. Determine el grado del polinomio 
necesario para alcanzar la precisión de los datos. 


10 | o 8 16 24 39 40 
o, mg/L | 14.62 1184 987 842 731 641 


19.16 Use el paquete de herramienta para el análisis de datos de 
Excel para ajustar una línea recta a los datos siguientes. Determine 
el intervalo de confianza el 90% para la intersección. Si abarca al 
cero, vuelva a hacer la regresión, pero con la intersección forzada a 
ser cero (ésta es una opción en el cuadro de diálogo de Regresión). 


x 2 4 6 8 10. 12 14 
y | 65 7 13- WE 19 258-269 


19.17 a) Emplee MATLAB para ajustar un trazador cúbico a los 
datos siguientes: 


Determine el valor de y en x= 1.5. b) Repita el inciso a), pero sin 
primeras derivadas en los nodos finales. Observe que la herramienta 
de ayuda de MATLAB describe cómo prescribir las derivadas finales. 
19.18 Use MATLAB para generar 64 puntos de la función 


F(t) = cos(101) + sen(3£) 


de £=0a2z. Con la función randn agregue un componente aleato- 
rio a la señal. Tome una TRF de estos valores y grafique los resulta- 
dos. 

19,19 En forma similar a como se hizo en la sección 19.8.2, use 
MATLAB para ajustar los datos del problema 19.15 con a) interpo- 
lación lineal, b) un polinomio de regresión de tercer grado y c) un 
trazador. Use cada enfoque para predecir la concentración de oxíge- 
no en T=10. 

19.20 La función de Runge es 


1 
ET 
Genere 9 valores equidistantes de esta función en el intervalo: [-1, 
1]. Ajuste estos datos con a) un polinomio de grado ocho, b) un 
trazador lineal y c) un trazador cúbico. Presente sus resultados en 
forma gráfica. 
19.21 Se inyecta un colorante al torrente circulatorio de un paciente 
para medir su salida cardiaca, que es la tasa de flujo volumétrico de 
la sangre del ventrículo izquierdo del corazón. En otras palabras, la 
salida cardiaca es el número de litros de sangre que el corazón bom- 
bea por minuto. Para una persona en reposo, la tasa puede ser de 5 o 
6 litros por minuto. Si se trata de un maratonista durante la carrera, 
la salida cardiaca puede ser tan elevada como 30 L/min. Los datos 
siguientes muestran la respuesta de un individuo cuando se inyectan 
5 mg de colorante en el sistema vascular. 


6 9 12 15 18 20 24 


Tiempo (s) | 2 
0.15 32 41 34 2 1 0 


Concentración (mg/L) | 


Ajuste una curva polinomial a través de los puntos de los datos y use 
la función para aproximar la salida cardiaca del paciente, que se 
puede calcular con: 


z ñ cantidad de colorante [ L 
Salida cardiaca = — - - 
área bajo la curva 1 min 
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19.22 En los circuitos eléctricos es común ver el comportamiento de 
la corriente en la forma de una onda cuadrada como se ilustra en la fi- 
gura P19.22. Al resolver para la serie de Fourier a partir de 


[4 0<t<TN 
HO= A, T/2<t<T 


se obtiene la serie de Fourier siguiente 


_ $ 44, 27r(2n—1)t 
s0= 2, Sl T ) 


Sea Ay=1 y T=0.25 s. Grafique los seis primeros términos de la serie 
de Fourier individualmente, así como la suma de dichos seis términos. 
Si es posible, use un paquete como Excel o MATLAB. 


Figura P19.22 


19.23 Haga una gráfica de los datos siguientes con a) un polinomio 
de interpolación de sexto grado, b) un trazador cúbico y c) un traza- 
dor cúbico con derivadas finales de cero. 


100 200 400 600 800 1000 


0 
160 | O 082436  1.00000  0.73576  0.40601  0.19915  0.09158 


En cada caso, compare la gráfica con la ecuación siguiente, la cual 
se utilizó para generar los datos 


x 
007 
e 


JE an 
=> 


Estudio de casos: ajuste 
de curvas 


El propósito de este capítulo es usar los métodos numéricos para el ajuste de curvas en la solución 
de algunos problemas de ingeniería. La primera aplicación, tomada de la ingeniería química, mues- 
tra cómo un modelo no lineal se puede linealizar y ajustar a datos mediante regresión lineal. La 
segunda aplicación utiliza trazadores para estudiar un problema que tiene relevancia en el área am- 
biental de la ingeniería civil: transporte de calor y de masa en un lago estratificado. 

La tercera aplicación ilustra cómo se emplea una transformada rápida de Fourier (TRF') en la 
ingeniería eléctrica, para analizar una señal determinando sus principales armónicas. La última 
aplicación muestra la forma en que se usa la regresión lineal múltiple para analizar datos experimen- 
tales en un problema de fluidos tomado de la ingeniería mecánica y aeronáutica. 


20.1 REGRESIÓN LINEAL Y MODELOS DE POBLACIÓN 
(INGENIERÍA QUÍMICA/BIOINGENIERÍA) 


Antecedentes Los modelos de crecimiento poblacional son importantes en diversos campos de 
la ingeniería. En muchos de los modelos es fundamental la hipótesis de que la razón de cambio de la 
población (dp/dt) es proporcional a la población existente (p) en cualquier tiempo (1), o en forma de 
ecuación, 


dp 
== 20.1 
dt kp di 


donde k = un factor de proporcionalidad conocido como velocidad de crecimiento específico y tiene 
las unidades de tiempo”!. Si k es una constante, entonces la solución de la ecuación (20.1) se obtiene 
de la teoría de las ecuaciones diferenciales: 


plo) = pe" (20.2) 


donde py = población cuando £= 0. En la ecuación (20.2) se observa que p(t) se aproxima al infinito 
conforme f crece. Tal comportamiento es claramente imposible en la realidad. Por lo tanto, el mo- 
delo debe modificarse para hacerlo más realista. 


Solución Primero, se debe reconocer que la velocidad de crecimiento específico k no puede ser 
una constante conforme la población crece. Éste es el caso debido a que, conforme p se aproxima al 
infinito, el fenómeno que está modelando se verá limitado por algunos factores como por ejemplo 
carencia de alimentos y producción de desechos tóxicos. Una manera de expresar esto en forma 
matemática es mediante el uso de un modelo de velocidad de crecimiento de saturación tal que 


E NE f (20.3) 
K+f 
donde k..;, = la velocidad de crecimiento máximo obtenible para valores grandes de alimento (f) y 
K=la constante de saturación media. En la figura 20.1 se tiene la gráfica de la ecuación (20.3) y se 
muestra que cuando f= K, k= Kk.,¿x/2. Por lo tanto, K es la cantidad de alimento disponible que per- 
mite una velocidad de crecimiento poblacional igual a la mitad de la velocidad máxima. 
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Figura 20.1 

Gráfica de la velocidad de crecimiento específico contra alimento 
disponible para el modelo de velocidad de crecimiento de satura- 
ción usado para caracterizar la cinética microbiana. El valor K 

se conoce como constante de saturación media porque concuerda 
con la concentración a la que la velocidad de crecimiento específico 
es la mitad de su valor máximo. 


Las constantes K y K;, 4, son valores empíricos obtenidos de 
mediciones experimentales de k para diversos valores de f. Por 
ejemplo, suponga que la población p representa la levadura em- 
pleada en la producción comercial de cerveza, y fes la concentra- 
ción de la fuente de carbono que será fermentada. Las mediciones 
de k contra f para la levadura se muestran en la tabla 20.1. Se re- 
quiere calcular K, 4, y Ka partir de estos datos empíricos. Esto se 
logra invirtiendo la ecuación (20.3) de manera similar a la ecuación 
(17.17) para obtener 


af, E 1 
k Kmmáx $ Knáx F nó 


(20.4) 


Con esta manipulación se ha transformado la ecuación (20.3) a 
una forma lineal; es decir, 1/k es una función lineal de 1/f, con 
pendiente K/Kk,,,, e intersección 1/Kk,,¿,. Estos valores se grafican 
en la figura 20.2. 

A causa de dicha transformación, se pueden utilizar los 
métodos por mínimos cuadrados lineales, descritos en el capí- 
tulo 17, para determinar K,,4, = 1.23 días”! y K = 22.18 mg/L. 
Los resultados, combinados con la ecuación (20.3), se comparan 
con los datos no transformados en la figura 20.3, y cuando se 
sustituyen en el modelo de la ecuación (20.1) dan el resultado 
siguiente: 


máx" 


Velocidad de crecimiento 
específico, k 


K 
Alimento disponible, f 


E) E 
o 2 [== ñ A 
Ss Pendiente = 
S máx 
1 
Intersección = En 
Kmnáx 
| | | | | | | [HERE 
0 0.04 0.08 0.12 0.16 
1/f, L/mg 
Figura 20.2 


Versión linealizada del modelo de la velocidad de creci- 
miento de saturación. La línea es un ajuste por mínimos 
cuadrados que se utiliza para evaluar los coeficientes del 
modelo k,:: = 1.23 días”! y k=22.18 mg/L para una levadu- 
ra que sirve para producir cerveza. 


Tabla 20.1 Datos utilizados para evaluar las constantes de un modelo de velocidad de 
crecimiento de saturación para caracterizar la cinética microbiana. 


f, mg/L k, día” 1/f, L/mg 1/k, día 

7 0.29 0.14286 3.448 

9 0.37 0.11111 2.703 

15 0.48 0.06666 2.083 

25 0.65 0.04000 1.538 
40 0.80 0.02500 1.250 
75 0.97 0.01333 1.031 
100 0.99 0.01000 1.010 
150 1.07 0.00666 0.935 
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k, día”? 


Figura 20.4 
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Figura 20.3 
Ajuste del modelo de velocidad de crecimiento 


50 100 150 de saturación para una levadura empleada en la 
f, mg/L producción comercial de cerveza. 


dP 193 


] P 
dt 22 18ef 


(20.5) 


Observe que el ajuste da una suma de los cuadrados de los residuos (como se calculó con los datos 
no transformados) es de 0.001305. 

La ecuación (20.5) se resuelve usando la teoría de las ecuaciones diferenciales o los métodos 
numéricos que se analizan en el capítulo 25 cuando se conoce f(t). Si fse aproxima a cero conforme 
p crece, entonces dp/dt se aproxima a cero y se estabiliza la población. 

La linealización de la ecuación (20.3) constituye una forma para evaluar las constantes Kmáx y 
K. Un procedimiento alternativo, que se ajusta a la relación en su forma original, es la regresión no 
lineal descrita en la sección 17.5. La figura 20.4 muestra cómo se emplea la herramienta Solver de 
Excel para estimar los parámetros con la regresión no lineal. Como se observa, se desarrolla una 
columna de valores predichos basada en el modelo y en los parámetros iniciales. Éstos se utilizan 
para generar una columna de residuos al cuadrado que se suman, y el resultado se coloca en la celda 
D14. Después se usa el Solver de Excel para minimizar la celda DÍ4 al ajustar las celdas B1:B2. El 
resultado, como se muestra en la figura 20.4, da estimados de kx = 1.23 y K= 22.14, con un S,= 
0.001302. De esta forma, aunque, como se esperaba, la regresión no lineal ofrece un ajuste ligera- 
mente mejor, los resultados son casi idénticos. En otros casos, esto puede no ser así (o la función 
quizá no sea compatible con linealización) y la regresión no lineal podría ser la única opción factible para 
obtener un ajuste por mínimos cuadrados. 


A B le] D 
kmáx 1.2301 =$B$1*A5/($B$2+A5) 
K 22.1386 


=(B5-C5)12 
f k  k-predicción Res?2 
0.29 0.295508 0.000030 
9 0.37  0.355536  0.000209 
15 0.48 0.496828 0.000283 
8 25 0.65 0.652385 0.000006 


9. 40 0.8 0.791843 0.000067 


Regresión no lineal para ajustar 10 75 0.97 0.949751 0.000410 
el modelo de la velocidad de 1 100 0.99 1.007135 0.000294 


crecimiento de saturación de una 12 150 1.07 1.071898 0.000004 =SUM(D5..D12) 
levadura empleada en la produc- nl 


ción comercial de cerveza. 


14 SsSsR 0.001302 


20.2 Uso de trazadores para estimar la transferencia de calor (ingeniería civil/ambiental) 


20.2 USO DE TRAZADORES PARA ESTIMAR LA TRANSFERENCIA DE 
CALOR (INGENIERÍA CIVIL/AMBIENTAL) 


Antecedentes Los lagos de la zona templada llegan a dividirse en 


estratos térmicos durante el verano. Como se ilustra en la figura 20.5, ia 
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cerca de la superficie, el agua es tibia y ligera, y en el fondo es más fría 0) = a = e V E 


y densa. La estratificación divide efectivamente el lago en dos capas en 
forma vertical: el epilimnion y el hipolimnion, separadas por un plano 


conocido como termoclina. ab 


Epilimnion 


La estratificación térmica tiene gran importancia para los ingenieros 
ambientales que estudian la contaminación de tales sistemas. En particular, 
la termoclina disminuye en gran medida la mezcla de las dos capas. Como 
resultado, la descomposición de la materia orgánica puede conducir auna gran 20 
reducción de oxígeno en el fondo aislado de las aguas. 

La ubicación de la termoclina se puede definir como el punto de in- 
flexión de la curva temperatura-profundidad; es decir, el punto donde d?T/ 30 
dx? = 0. Es también el punto en el cual el valor absoluto de la primera de- 
rivada o gradiente es un máximo. Utilice trazadores cúbicos para determi- 
nar la profundidad de la termoclina en el lago Platte (tabla 20.2). También 


z (m) 


HET 


Figura 20.5 


== Termoclina 


Hipolimnion 


Temperatura contra profundidad durante el verano 


use los trazadores para determinar el valor del gradiente en la termoclina. — on q] | ago Platte, Michigan. 


Solución Los datos se analizan con un programa que se desarrolló con 
base en el pseudocódigo de la figura 18.18. Los resultados se muestran en 
la tabla 20.3 que da las predicciones del trazador junto con las primera y 
segunda derivadas a intervalos de 1 m hacia abajo a través de la columna 
de agua. 
Los resultados se grafican en la figura 20.6. Observe cómo la termoclina está claramente locali- 
zada en la profundidad donde el gradiente es mayor (es decir, el valor absoluto de la derivada es mayor) 
y la segunda derivada es cero. La profundidad es 11.35 m y el gradiente en este punto es —1.61*C/m. 


Tabla 20.2 Temperatura contra profundidad durante el verano en el lago Platte, Michigan. 


T,*C | 22.8 22.8 22.8 20.6 13.9 11.7 11.1 11.1 
z,m | 0 2.3 4.9 9.1 13.7 18.3 22.9 27.2 


Tabla 20.3 Resultados del programa trazadores basado en el pseudocódigo de la figura 18.18. 


Profundidad Profundidad 
(m) T(C) dT/dz d2T/dz2 (m) T(C) 
0, 22.8000 -.0115 .0000 15% 12.7652 
l. 22.7907 -.0050 .0130 16. 12.2483 
Dis 22.7944 .0146 .0261 17. 11.9400 
3 22.8203 .0305 -.0085 18. 11.7484 
4. 22.8374 =40055 -.0635 19. 11.5876 
Ds 22.7909 -.0966 -.1199 20. 11.4316 
6. 22.6229 -.2508 -.1884 21. 11.2905 
a 22.2665 -.4735 -.2569 22 11.745 
8. 21.6531 -.7646 -.3254 23 11.0938 
9. 20.7144 -1.1242 -.3939 24. 11.0543 
10. 19.4118 -1.4524 -.2402 25% 11.0480 
11. 17.8691 -1.6034 -.0618 26. 11.0646 
12. 16.2646 1.5759 .1166 27. 11.0936 
13. 14.7766 -1.3702 2950 28. 11.1000 
14. 13.5825 -.9981 .3923 


dT/dz d2T/dz2 
-.6518 .3004 
-.3973 .2086 
-.2346 .1167 
-.1638 .0248 
-.1599 .0045 
-.1502 .0148 
«1303 .0251 
-.1001 .0354 
-.0596 .0436 
-.0212 ¿0332 

.0069 .0229 

.0245 .0125 

.0318 .0021 

.0000 .0000 
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a) 


TC dT/dz d?r/d2 

0 10 -20 -10 0.0 -0.5 0.0 0.5 

HARAN AAA Al AAA HARI 
E - = Termoclina 
E Figura 20.6 
E Gráficas de a) temperatura, b) gradiente y c) 
E segunda derivada contra profundidad (m) gene- 
[Ez radas con el programa de trazadores cúbicos. La 
E termoclina se localiza en el punto de inflexión de 


b) o la curva temperatura-profundidad. 


20.3 ANÁLISIS DE FOURIER (INGENIERÍA ELÉCTRICA) 


Antecedentes El análisis de Fourier se emplea en muchas áreas de la ingeniería. Se utiliza de 
manera extensiva en problemas de la ingeniería eléctrica como el procesamiento de señales. 

En 1848, Johann Rudolph Wolf diseñó un método para cuantificar la actividad solar contando 
el número de manchas y grupos de manchas en la superficie solar. Calculó una cantidad, que ahora 
se conoce como el número de manchas solares de Wolf, sumando 10 veces el número de grupos más 
el número de manchas solares. Como se observa en la figura 20.7, el registro de este número se re- 
monta a 1700. Basándose en los primeros datos históricos, Wolf determinó que la longitud del ciclo 
es de 11.1 años. 

Use un análisis de Fourier para confirmar este resultado mediante la aplicación de una TRF a 
los datos de la figura 20.7. Determine con toda precisión el periodo desarrollando una gráfica de 
potencia contra periodo. 


Solución Los datos de años y el número de manchas solares se bajaron de Internet! y se guarda- 
ron en un archivo llamado: sunspot.dat. El archivo se puede cargar en MATLAB y la información 
del año y el número se le asignó a vectores con los mismos nombres, 


>> load sunspot.dat 
>> year=sunspot (:,1);¿number=sunspot (:,2); 


A continuación, se aplica una TRF a los números de manchas solares 
>> y=fft (number) ; 


Una vez obtenida la primera armónica, se determina la longitud de la transformada rápida de Fourier 
(n) y luego se calculan la potencia y la frecuencia, 


>> y(1)=[ 1; 

>> n=length (y); 

>> power=abs (y (1:n/2)).2; 

>> nyquist=1/2; 

>> freg=(1:n/2)/(n/2)*nyquist; 


LAI momento de la impresión de la edición en inglés de este libro la página era http://www.ngdc.noaa.gov//stp/SOLAR/SSN/ 
ssn.html. 
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Figura 20.7 Ñ 
Gráfica del número de manchas solares de Wolf a MAT AT A MA MUA TUN 
contra años. 1700 1800 1900 2000 


En este momento, el espectro de potencia es una 
gráfica de potencia contra frecuencia. Sin embargo, 
como el periodo es más significativo en el contexto 
presente, se puede determinar el periodo y una 
gráfica potencia-periodo, 


>> period=1./freqg 


>> plot (period, power); 


Potencia (X 107) 


El resultado, como se muestra en la figura 20.8, 
indica un pico alrededor de 11 años. El valor exac- 


20 


30 


0 10 
to se calcula con ; x 
Periodo (años) 
>> index=find (power==max (power) ); 
>> period(index) Figura 20.8 
Espectro de potencia para el número de manchas solares de Wolf. 
ans= 
10.9259 


20.4 ANÁLISIS DE DATOS EXPERIMENTALES 
(INGENIERÍA MECÁNICA/AERONÁUTICA) 


Antecedentes Las variables de diseño en la ingeniería son a menudo dependientes de varias 
variables independientes. Por lo común, esta dependencia funcional se caracteriza mejor con ecua- 
ciones de potencia multivariable. Como se analizó en la sección 17.3, una regresión lineal múltiple 
de datos transformados a logaritmos ofrece un recurso para evaluar tales relaciones. 

Por ejemplo, un estudio en ingeniería mecánica indica que el flujo de un líquido a través de una 
tubería está relacionado con el diámetro y la pendiente de la tubería (tabla 20.4). Use regresión lineal 
múltiple para analizar estos datos. Después con el modelo resultante prediga el flujo en una tubería de 
2.5 ft de diámetro y con pendiente de 0.025 ft/ft. 


Solución La ecuación de potencias a evaluarse es 
O= a Dusa (20.6) 


donde O = flujo (ft/s), S = pendiente (ft/ft), D = diámetro de la tubería (ft) y ay, a, y a, = coeficien- 
tes. Tomando los logaritmos de esta ecuación se obtiene 


log O = log ay + a, log D + a, log S 


En esta forma, la ecuación es adecuada para una regresión lineal múltiple, ya que log O es una 
función lineal de log S y log D. Usando el logaritmo (base 10) de los datos de la tabla 20.4, se gene- 
ran las siguientes ecuaciones expresadas en forma matricial [ecuación (17.22)]: 
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Tabla 20.4 Datos experimentales de diámetro, pendiente y flujo 
en una tubería circular de concreto. 
Experimento Diámetro, ft Pendiente, ft/ft Flujo, ft3/s 
1 1 0.001 1.4 
2 2 0.001 8.3 
3 3 0.001 24.2 
4 1 0.01 4.7 
5 2 0.01 28.9 
6 3 0.01 84.0 
7 1 0.05 11.1 
8 2 0.05 69.0 
9 3 0.05 200.0 
9 2.334 18.903) [log a, 11.691 
2.334 0.954 4.903 a, p=3 3.945 
-18.903 -4.903 44.079 a, 22.207 
Este sistema se resuelve utilizando la eliminación de Gauss para obtener 
log a, = 1.7475 
a, =2.62 
a, = 0.54 
Si log a, = 1.7475, entonces a, = 101743 = 55,9, y la ecuación (20.6) ahora es 
O = 55.9D2:250.54 (20.7) 
La ecuación (20.7) se utiliza para predecir el flujo para el caso de D=2.5 ft y S = 0.025 ft/ft, como 
sigue 
O =55.9(2.5)*20.025)59% = 84.1 ft%/s 
Debe observarse que la ecuación (20.7) se utiliza para otros propósitos, además del cálculo de 
flujo. Por ejemplo, la pendiente se relaciona con la pérdida de presión h, y la longitud de tubería L 
mediante S = h,/L. Si esta relación se sustituye en la ecuación (20.7) y en la fórmula resultante se 
despeja h,, se obtiene la siguiente ecuación: 
L 
" ES 1.85 ¡py4.85 
=77212 
Esta relación se conoce como ecuación de Hazen-Williams. 
PROBLEMAS 


Ingeniería química/bioingeniería 

20.1 Desarrolle el mismo cálculo que en la sección 20.1, pero use 
regresión lineal y transformaciones para ajustar los datos con una 
ecuación de potencias. Evalúe el resultado. 

20.2 Usted lleva a cabo experimentos y determina los valores si- 
guientes de capacidad calorífica c a distintas temperaturas T para un 
gas: 


30 0 60 90 110 


Cc | 1270 1280 1350 1480 1580 1700 


Use regresión para determinar un modelo para predecir c como fun- 
ción de 7. 


20.3 Se sabe que el esfuerzo a la tensión de un plástico se incremen- 
ta como función del tiempo que recibe tratamiento a base de calor. 
Se obtuvieron los datos siguientes: 


Tiempo | 10 15 20 25 40 50 55 60 75 
Esfuerzo a la tensión | 5 20 18 40 33 54 70 60 78 


a) Ajuste una línea recta a estos datos y utilice la ecuación para 

determinar el esfuerzo a la tensión en un tiempo de 32 min. 

b) Repita el análisis para una línea recta con intersección en el origen. 
20.4 Los datos siguientes se recabaron para determinar la relación 
entre la presión y la temperatura de un volumen fijo de 1 kg de ni- 
trógeno. El volumen es de 10 mP. 


| 40 0 40 80 120 160 
8100 9300 10500 11700 12900 


T,eC 
p, Nim? | 6900 


Emplee la ley del gas ideal pV=nxRT para determinar R sobre la base 
de dichos datos. Observe que para la ley, T debe expresarse en kelvins. 
20.5 El volumen específico de un vapor sobrecalentado se enlista en 
tablas de vapor para distintas temperaturas. Por ejemplo, a una presión 
absoluta de 3 000 lb/in?: 


740 760 780 
0.14060 0.15509 0.16643 


1, > | 700 720 
v, f8/b,, | 0.0977 0.12184 


Determine v con T= 750%F. 
20.6 Un reactor está estratificado térmicamente en la tabla siguiente: 


Temperatura T, *C 


0 20 40 60 
0 E 
We , 
IN A Termoclina 
N 
Te) 
ls) 
2 le 
9) 
3 
5 
E 
8 
£3l 
Y 
Figura P20.6 
Profundidad, m | 0 0.5 1.0 1.5 2.0 2.5 3.0 
Temperatura, *C | 70 68 55 22 13 11 10 


Como se ilustra en la figura P20.6, el tanque puede idealizarse como 
dos zonas separadas por un gradiente fuerte de temperatura, o termo- 
clina. La profundidad de este gradiente se define como el punto de 
inflexión de la curva temperatura-profundidad, es decir, el punto en 
el que 47T/d2? = 0. A esta profundidad, el flujo de calor de la super- 
ficie a la capa del fondo se calcula con la ley de Fourier: 


pao 
dz 


Use un ajuste con trazadores cúbicos de estos datos para determinar 
la profundidad de la termoclina. Si k= 0.02 cal/(s - cm - *C), calcule 
el flujo a través de esta interfaz. 

20.7 En la enfermedad de Alzheimer, el número de neuronas en la 
corteza disminuye conforme la enfermedad avanza. Los datos si- 
guientes se tomaron para determinar el número de receptores neuro- 
transmisores que quedan en un cerebro enfermo. Se incubaron 
neurotransmisores libres ([F]) con tejido, y se midió la concentración 
que limita específicamente a un receptor ([B]). Cuando la cubierta es 
específica de un receptor, la concentración límite se relaciona con la 
concentración libre por medio de la relación siguiente: 


Problemas 445 


Baró [ 


[B]= e 
—K+[F] 


Con el uso de los datos siguientes, determine los parámetros que 
minimizan la suma de los cuadrados de los residuos. Asimismo, 
calcule 1?. 


[F], nM | 0.1 0.5 1 5 10 20 50 
[B], nM | 10.57 36.61 52.93 82.65 89.46 94.35 101.00 


20.8 Se tomaron los datos siguientes del tanque de un reactor de 
agitación para la reacción A > B. Use los datos para hacer las esti- 
maciones mejores posibles para ky, y E,, para el modelo cinético 
siguiente, 


donde R es la constante de los gases y es igual a 0.00198 Kcal/mol/K 


-dA/dt (moles/U/s) 460 960 2485 1600 1245 
A (moles/L) 200 150 50 20 10 
T(K) 280 320 450 500 550 


20.9 Emplee el conjunto siguiente de datos de presión-volumen para 
encontrar las mejores constantes viriales posibles (A, y A,) para la 
ecuación de estado que se muestra a continuación. R = 82.05 ml atm/ 
gmol K y T= 303 K. 


PV A 4, 
—= 1424 
RT vo v 
P (atm) | 0.985 1.108 1.363 1.631 
V (ml) | 25 000 22 200 18 000 15 000 


20.10 Se tomaron datos de concentración en 15 puntos temporales 
para la reacción de polimerización: 


xXA+yB> A,B, 


Se supone que la reacción ocurre a través de un mecanismo comple- 
jo que consiste en muchas etapas. Se han planteado varios modelos 
hipotéticos y calculado la suma de los cuadrados de los residuos para 
los ajustes de los modelos a los datos. A continuación se presentan los 
resultados. ¿Cuál es el modelo que describe mejor los datos (estadís- 
ticamente)? Explique su respuesta. 


Modelo A Modelo B Modelo C 


S, 135 105 100 
Número de modelo 


parámetros del ajuste 2 3 5 


20.11 A continuación se presentan datos de la vasija de un reactor 
de crecimiento bacterial (una vez que terminó la fase de retraso). Se 
permite que las bacterias crezcan tan rápido como sea posible duran- 
te las primeras 2.5 horas, y después se les induce a producir una 
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proteína recombinante, la cual disminuye el crecimiento bacterial en 
forma significativa. El crecimiento teórico de las bacterias se descri- 
be por medio de: 


Ex 
dt 

donde X es el número de bacterias, y u es la tasa de crecimiento es- 
pecífico de las bacterias durante el crecimiento exponencial. Con 
base en los datos, estime la tasa de crecimiento específico de las 
bacterias durante las primeras 2 horas de crecimiento, así como du- 
rante las siguientes 4 horas de crecimiento. 


Tiempo, h | 0 1 2 3 4 5 6 


[Células], g/L | 0.100 0.332 1.102 1.644 2.453 3.660 5.460 


20.12 El peso molecular de un polímero se determina a partir de su 
viscosidad por medio de la relación siguiente: 


[n] = KM; 


donde [7] es la viscosidad intrínseca del polímero, M, es la viscosidad 
promediada del peso molecular, y K y a son constantes específicas 
del polímero. La viscosidad intrínseca se determina en forma expe- 
rimental por medio de determinar el tiempo de flujo, o el tiempo que 
toma a la solución polimérica fluir entre dos líneas grabadas en un 
viscosímetro capilar, a distintas concentraciones de polímero diluido, 
y se extrapola para una dilución infinita. La gráfica de 


1 
A] 
Í 


versus C 
Cc 


debe generar una línea recta, con intersección en el eje y igual a [y]. La 
concentración de la solución polimérica es c, t es el tiempo de flujo de 
la solución polimérica, y f es el tiempo de flujo del solvente sin políme- 
ro. Con el uso de los datos siguientes de tiempos de flujo, para solucio- 
nes diluidas de poliestireno en metil etil acetona a 25*C, y las constantes 
K=3.9 x 10*, y a=0.58, encuentre el peso molecular de la muestra de 
poliestireno. 


Concentración 


de polímero, g/dL Tiempo de flujo, s 


O (solvente puro) 83 
0.04 89 
0.06 95 
0.08 104 
0.10 114 
0.12 126 
0.14 139 
0.16 155 
0.20 191 


20.13 En promedio, el área superficial A de los seres humanos se 
relaciona con el peso W y la estatura A. En la tabla siguiente se pre- 
sentan los valores de A que se obtuvieron con mediciones de cierto 
número de individuos: 
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H (cm) | 182 180 179 187 189 194 195 193 200 
W (kg) 74 88 94 78 84 98 76 86 96 
A (m?) 192 2.11 2.115 2.002 2.09 2.31 2.02 2.16 2.31 


Desarrolle una ecuación para pronosticar el área como función de la 
estatura y el peso. Utilícela para estimar el área superficial de una 
persona de 187 cm y 78 kg. 

20.14 Determine una ecuación para predecir la tasa del metabolismo 
como función de la masa con base en los datos siguientes: 


Animal Metabolismo, watts 


Masa, kg 
Vaca 400 270 
Humano 70 82 
Oveja 45 50 
Gallina Z 4.8 
Rata 0.3 1.45 
Paloma 0.16 0.97 


20.15 La sangre humana se comporta como un fluido newtoniano 
(véase el problema 20.55) en la región de la tasa de corte alto, donde 
y > 100. En la región de tasa de corte bajo, donde y < 50, los glóbu- 
los rojos tienden a agregarse en lo que se denomina rouleaux (rodi- 
llos), que hacen que el comportamiento del fluido ya no sea 
newtoniano. Esta región de corte bajo se denomina región de Casson, 
y es una región de transición entre las dos regiones de flujo distinto. 
En la región de Casson, conforme la tasa de corte se aproxima a cero, 
el esfuerzo cortante adquiere un valor finito, similar al plástico 
Bingham, lo que se denomina esfuerzo inducido, T,, el cual debe 
superarse a fin de iniciar el flujo en la sangre estancada. El flujo en 
la región de Casson por lo general se grafica como la raíz cuadrada 
de la tasa de corte versus la raíz cuadrada del esfuerzo cortante, y 
sigue una relación lineal al graficarse de este modo. La relación de 
Casson es 


Je = fr, +K. 7 


donde K, = índice de consistencia. En la tabla siguiente se muestran 
valores medidos en forma experimental de y y T, para una sola mues- 
tra de sangre en las regiones de Casson y de flujo newtoniano. 


Y, 1/s 0.91 3.3 4.1 6.3 9.6 23 36 

T, N/m? 0.059 0.15 0.19 0.27 0.39 0.87 1.33 
Región Casson 

Y, 1/s 49 65 105 126 215 315 402 
T, N/m? 1.65 2.11 3.44 4.12 7.02 10.21 13.01 
Región Transición Newtoniano 


Encuentre los valores de K, y T, por medio de regresión lineal en la 
región de Casson, y halle yu con regresión lineal en la región newto- 
niana. También calcule el coeficiente de correlación para cada aná- 
lisis de regresión. Grafique las dos rectas de regresión en una gráfica 
de Casson ( Sy versus ,f/7 ) y extienda las rectas de regresión como 
líneas punteadas hacia las regiones adyacentes; también incluya los 
puntos de los datos en la gráfica. Limite la región de la tasa de corte 


a0< yy <15. 


20.16 El tejido suave sigue un comportamiento exponencial ante la 
deformación por tensión uniaxial, mientras esté en el rango fisioló- 
gico o normal de elongación. Esto se expresa como 


E, ae 
o=—(e" —1) 
a 


donde O = esfuerzo, e = tensión, y E, y a son constantes del material 
que se determinan en forma experimental. Para evaluar las dos cons- 
tantes del material, la ecuación anterior se diferencia con respecto a 
e. El uso de la ecuación establece la relación fundamental para el 
tejido suave 


d 
“O E,+a0 
de 


Para evaluar Ej, y a, se grafican los datos de esfuerzo-tensión como 
dolde versus O, y la intersección y la pendiente de esta gráfica son 
las dos constantes del material, respectivamente. 

En la tabla siguiente se muestran datos de esfuerzo-tensión para 
los tendones cordados del corazón (tendones pequeños que se usan 
para mantener cerradas las válvulas del corazón durante la contrac- 
ción del músculo cardiaco; estos datos son para tejido que se carga, 
mientras que la descarga produce curvas diferentes). 


a, 10? N/m? 87.8 96.6 176 263 351 571 834 
e, 107 m/m 153 204 255 306 357 408 459 
a, 107 N/m? 1229 1624 2107 2678 3380 4258 
e, 107 m/m 510 561 612 663 714 765 


Calcule la derivada do/de con el uso de diferencias finitas. Grafique los 
datos y elimine los puntos de los datos cerca de los ceros que parez- 
can no seguir la relación de línea recta. El error en dichos datos pro- 
viene de la incapacidad de los instrumentos para leer los valores 
pequeños en esta región. Ejecute un análisis de regresión de los datos 
restantes a fin de determinar los valores de E, y a. 

Grafique los puntos del esfuerzo versus los de tensión junto con la 
curva analítica expresada por la primera ecuación. Esto indicará qué tan 
bien la curva analítica concuerda con los datos. 

Muchas veces esto no funciona bien debido a que el valor de E, 
es difícil de evaluar con esta técnica. Para resolver este problema, no 
se utiliza E,. Se selecciona un punto de los datos (0, e) a la mitad 
del rango del análisis de regresión. Dichos valores se sustituyen en la 
primera ecuación y se determina un valor de E,,/a, el cual se sustituye 
en la primera ecuación, que se convierte en 


Con este enfoque, los datos experimentales que están bien definidos 
producirán una buena coincidencia de los puntos de los datos con la 
curva analítica. Use esta nueva relación y grafique otra vez los datos 
del esfuerzo versus los de tensión, y esta curva analítica nueva. 

20.17 El espesor de la retina cambia durante ciertas enfermedades 
oculares. Una forma de medir dicho espesor es proyectar un láser de 
energía muy baja hacia la retina y grabar las reflexiones en una pe- 
lícula. Debido a las propiedades ópticas del ojo, las reflexiones de la 
superficie frontal y trasera de la retina aparecerán en la película como 
dos líneas separadas por cierta distancia. Esta distancia es proporcio- 
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nal al espesor de la retina. Los datos siguientes se tomaron de una 
película grabada. Ajuste a los datos dos curvas con forma gaussiana 
de altura y ubicación arbitrarias, y determine la distancia entre los 
centros de los dos picos. Una curva gaussiana tiene la forma 


ke a y 


SON 


donde k y a son constantes que relacionan la altura con el centro del 
pico, respectivamente. 


Intensidad Intensidad 
Posición de luz Posición de luz 
0.17 5.10 0.31 25.31 
0.18 5.10 0.32 23.79 
0.19 5.20 0.33 18.44 
0.20 5.87 0.34 12.45 
0.21 8.72 0.35 8.22 
0.22 16.04 0.36 6.12 
0.23 26.35 0.37 5.35 
0.24 31.63 0.38 5.13 
0.25 26.51 0.39 5.10 
0.26 16.68 0.40 5.10 
0.27 10.80 0.41 5.09 
0.28 11.26 0.42 5.09 
0.29 16.05 0.43 5.09 
0.30 21.96 0.44 5.09 


20.18 Los datos que se tabulan en seguida se generaron en un expe- 
rimento con contenido inicial de cianato de amonio puro (NH¿OCN). 
Se sabe que tales cambios de concentración se pueden modelar por 
la siguiente ecuación: 


CO 
=> 
1 + kcot 


donde cy y kson parámetros. Use una transformación para linealizar 
esta ecuación. Luego use regresión lineal para predecir la concentra- 
ción a t= 160 min. 


t (min) | 0 20 50 65 150 
| 0.381 0.264 0.180 0.151 0.086 


c (moles/L) 


Ingeniería civil/ambiental 

20.19 A continuación se enlistan los esfuerzos cortantes, en kilopas- 
cales (kPa), de nueve especímenes tomados a distintas profundidades 
de un estrato arcilloso. Estime el esfuerzo cortante a la profundidad de 
45m. 


Profundidad, m | 19 31 4.2 5.1 58 69 8.1 93 10.0 
Esfuerzo, kPa | 12.4 28.7 192 43.1 33.5 52.7 718 62.2 76.6 


20.20 Se realizó un estudio de ingeniería del transporte para deter- 
minar el diseño apropiado de pistas para bicicletas. Se recabaron 
datos del ancho de las pistas y la distancia promedio entre las bici- 
cletas y los autos en circulación. Los datos de 9 calles son 
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Tabla P20.21 Concentración de oxígeno disuelto en agua como función de la temperatura (*C) y la concentración 


de cloruro (g/L). 


Oxígeno disuelto (mg/L) para la temperatura (*C) 
y la concentración de cloruro (g/L) 


T,*C c=0 g/L c= 10 g/L c= 20 g/L 
0 14.6 12.9 11.4 
5 12.8 11.3 10.3 
10 11.3 10.1 8.96 
15 10.1 9.03 8.08 
20 9.09 8.17 7.35 
25 8.26 7.46 6.73 
30 7.56 6.85 6.20 
Distancia, m | 24 15 24 18 18 29 12 3 12 tación que se extienden mucho hacia el pasado. Por lo tanto, con 
- frecuencia resulta útil determinar una relación entre el flujo y la 
Ancho de la pista, m | 29 21 23 21 18 27 15 29 1.5 


a) Grafique los datos. 

b) Ajuste una línea recta a los datos con regresión lineal. Agregue 
esta línea a la gráfica. 

c) Si se considera que la distancia promedio mínima de seguridad 
entre las bicicletas y los autos en circulación es de 2 m, determine 
el ancho de pista mínimo correspondiente. 

20.21 En la tabla P20.21 se enlista la concentración de saturación 
del oxígeno disuelto en agua como función de la temperatura y la 
concentración de cloruro. Utilice interpolación para estimar el nivel 
de oxígeno disuelto para T= 18*C con cloruro = 10 g/L. 

20.22 Para los datos de la tabla P20.21, use regresión polinomial 
para obtener una ecuación predictiva de tercer grado para la concen- 
tración del oxígeno disuelto como función de la temperatura, para 
el caso en que la concentración de cloruro es igual a 10 g/L. Emplee 
la ecuación para estimar la concentración de oxígeno disuelto para 
T=8"C. 

20.23 Use regresión lineal múltiple para obtener una ecuación predic- 
tiva para la concentración del oxígeno disuelto como función de la 
temperatura y el cloruro, con base en los datos de la tabla P20.21. Use 
la ecuación para estimar la concentración de oxígeno disuelto para una 
concentración de cloruro de 5 g/Len T'= 17*C. 

20.24 En comparación con los modelos de los problemas 20.22 y 
20.23, es posible plantear la hipótesis de un modelo algo más elabo- 
rado que toma en cuenta el efecto tanto de la temperatura como del 
cloruro sobre la saturación del oxígeno disuelto, el cual tiene la 
forma siguiente: 


0,= dy +1) + f(c) 


Es decir, una constante más un polinomio de tercer grado en la tem- 
peratura y una relación lineal en el cloruro, se supone que dan resul- 
tados mejores. Use el enfoque lineal general de mínimos cuadrados 
para ajustar este modelo a los datos de la tabla P20.21. Emplee la 
ecuación resultante para estimar la concentración de oxígeno disuel- 
to para una concentración de cloruro de 10 g/L a T= 20*C. 

20.25 En la ingeniería de recursos hidráulicos, el tamaño de los al- 
macenamientos depende de estimaciones exactas del flujo de agua 
en el río que se va a captar. Para ciertos ríos es difícil obtener regis- 
tros históricos extensos de dichos datos de flujo. Por el contrario, es 
frecuente que se disponga de datos meteorológicos sobre la precipi- 


precipitación. Entonces, esta relación se utiliza para estimar los 
flujos durante los años en que sólo se dispone de medidas pluviales. 
Se dispone de los datos siguientes para un río que va a represarse: 


Precipitación, cm 88.9 108.5 104.1 139.7 127 9 116.8 99.1 


14.6 


Flujo, m3/s 


a) Grafique los datos. 

b) Ajuste una línea recta a los datos por medio de regresión lineal. 
Sobreponga esta línea a su gráfica. 

c) Use la línea de mejor ajuste para predecir el flujo anual de agua 
si la precipitación es de 120 cm. 

d) Si el área de drenaje es de 1100 km?, estime la fracción de la 
precipitación que se pierde a través de procesos como la eva- 
poración, infiltración y uso consuntivo. 

20.26 La concentración del fósforo total (p en mg/m) y clorofila a 

(c en mg/m?) para cada uno de los Grandes Lagos en el año de 1970, 

fue 


p 3 
Lago Superior 45 0.8 
Lago Michigan 8.0 2.0 
Lago Hurón 5.0 112 
Lago Erie: 
Cuenca oeste 39.0 11.0 
Cuenca central 19.5 4.4 
Cuenca este 17.5 3.8 
Lago Ontario 21.0 5.5 


La concentración de clorofila a indica cuánta vida vegetal se encuen- 
tra en suspensión en el agua. Al ser así, indica la claridad y visibilidad 
del agua. Use los datos anteriores para determinar la relación de c 
como función de p. Emplee la ecuación para predecir el nivel de 
clorofila que puede esperarse si se utiliza el tratamiento del agua 
para abatir a 10 mg/m? la concentración de fósforo del Lago Erie 
occidental. 

20.27 El esfuerzo vertical O, bajo la esquina de un área rectangular 
sujeta a una carga uniforme de intensidad q, está dada por la solución 
de la ecuación de Boussinesq;: 


Cd mMain+limn man +1 


_ 4 a main+2 


main+l+min? 


ne 2mmm*+n? +1 j] 


Debido a que es inconveniente resolver esta ecuación manualmente, 
ha sido reformulada como 


o. =4f.(m, n) 


donde f.(m, n) se denomina el valor de influencia, y m y n son razo- 
nes adimensionales, con m = a/lz y n = bÍz, y a y b se encuentran 
definidas en la figura P20.27. Después se tabula el valor de influen- 
cia, una parte de la cual está dada en la tabla P20.27. Si a=4.6 y b 
= 14, use un polinomio de interpolación de tercer grado para calcular 
9, a una profundidad de 10 m por debajo de la esquina de una corni- 
sa rectangular que está sujeta a una carga total de 100 t (toneladas 
métricas). Exprese su respuesta en toneladas por metro cuadrado. 
Observe que q es igual a la carga por área. 


L— b A 


Figura P20.27 


Tabla P20.27 


n=1.6 


m n=1.2 n=1.4 

0.1 0.02926 0.03007 0.03058 
0.2 0.05733 0.05894 0.05994 
0.3 0.08323 0.08561 0.08709 
0.4 0.10631 0.10941 0.11135 
0.5 0.12626 0.13003 0.13241 
0.6 0.14309 0.14749 0.15027 
0.7 0.15703 0.16199 0.16515 
0.8 0.16843 0.17389 


0.17739 


20.28 Tres organismos patógenos decaen en forma exponencial en 
aguas de un lago de acuerdo con el modelo siguiente: 


p(t) = Ae + Be? + Ce 005: 


Estime la población inicial de cada organismo (A, B y C), dadas las 


mediciones siguientes: 
th | 0.5 1 2 3 4 5 6 7 9 
pto 60 44 32 27 22 19 17 14 11 


Problemas 449 


20.29 El mástil de un velero tiene un área de sección transversal de 
10.65 cm?, y está construido de una aleación experimental de alumi- 
nio. Se llevaron a cabo pruebas para definir la relación entre el es- 
fuerzo y la tensión. Los resultados de las pruebas fueron los que 
siguen: 


Tensión, cm/cm 0.0032 0.0045 0.0055 0.0016 0.0085 0.0005 


4970 5170 5 500 3 590 6 900 


Esfuerzo, N/cm? 


1240 


Los esfuerzos ocasionados por el viento se calculan como F/A,; don- 
de F = fuerza en el mástil y A, = área de la sección transversal del 
mástil. Después, este valor se sustituye en la ley de Hooke para de- 
terminar la deflexión del mástil, AL= tensión x L, donde L= longitud 
del mástil. Si la fuerza del viento es de 25000 N, use los datos para 
estimar la deflexión de un mástil de 9 m. 

20.30 En la ingeniería ambiental, las reacciones enzimáticas se 
utilizan mucho para caracterizar reacciones mediadas biológicamen- 
te. A continuación se dan expresiones de tasas propuestas para una 
reacción enzimática, donde [S] es la concentración del sustrato y v, 
es la tasa inicial de la reacción. ¿Qué fórmula se ajusta mejor a los 
datos experimentales? 


k1S] k[S]? Kk[ST 
Y, =k[S] v, = o z » = 
K+[S] K+I[S] K-+[S] 
[S], M Tasa inicial, 10 M/s 
0.01 6.3636 x 105 
0.05 7.9520 x 107? 
0.1 6.3472 x 102 
0.5 6.0049 
1 17.690 
5 24.425 
10 24.491 
50 24.500 
100 


24.500 


20.31 Los ingenieros ambientales que estudian los efectos de la 
lluvia ácida deben determinar el valor del producto iónico del agua 
K;, como función de la temperatura. Los científicos sugieren la ecua- 
ción siguiente para modelar dicha relación. 


—1lo2¡) K,, = - *blog T, +cT,+d 


donde 7, es la temperatura absoluta (K), y a, b, c y d son parámetros. 
Emplee los datos siguientes y la regresión para estimar los parámetros: 


T, (K) 273.15 283.15 293.15 
Ko 1.164 x 10-13 2.950x 105 6.846 x 101 
1,(K) | 303.15 313.15 

Ko | 1.467 x 10-14 2.929 x 101 


20.32 Un ingeniero ambiental reportó los datos tabulados más abajo 
de un experimento para determinar la tasa de crecimiento de bacterias, 
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k, en función de la concentración de oxígeno, c. Se sabe que a dichos 


datos se les puede aplicar el modelo de la siguiente ecuación: 
KmáxC S 

k = —=>G 

+0? 


donde c, y Kk..,, son parámetros. Emplee una transformación para li- 
nealizar esta ecuación, y después use regresión lineal para estimar c, 
Y Kmax y predecir la tasa de crecimiento en c =2 mg/L. 


c (mg/L) 0.5 0.8 1.5 2.5 4 
k (por día) 1.1 2.4 5.3 7.6 8.9 


20.33 El siguiente modelo se usa frecuentemente en ingeniería am- 
biental para parametrizar el efecto de la temperatura, 7 (*C), en las 
rapideces de reacción bioquímica, k (por día), 


E= la 


donde k», y O son parámetros. Use una transformación para linealizar 
esta ecuación. Luego use regresión lineal para estimar k»y y O y pre- 
diga la rapidez de reacción a T= 17*C. 


TEC) 6 12 18 24 30 
k (por día) 0.20 0.31 0.46 0.69 


20.34 Como miembro de Ingenieros sin Fronteras, usted está traba- 
jando en una comunidad que tiene su agua de beber contaminada. En 
t=0, usted agrega un desinfectante a una cisterna que está contami- 
nada con bacterias. Usted hace las siguientes mediciones a distintos 
tiempos desde ese momento: 


t(h) 2 4 6 8 10 
Cc (+/100 mL) 430 190 80 35 16 


Si el agua es segura para beber cuando la concentración caiga por 
debajo de 5 ++/100 mL, estime el tiempo en que la concentración 
caerá por debajo de este límite. 

Ingeniería eléctrica 

20.35 Lleve a cabo los mismos cálculos que en la sección 20.3, pero 
analice los datos generados con f(t) = 4 cos(51) — 7 sen(31) + 6. 


20.36 Se mide la caída de voltaje V a través de un resistor para 
cierto número de valores distintos de corriente /. Los resultados son 


¡ 0.25 
V 0.45 


0.75 
0.6 


1:25 15 2.0 
0.70 1.88 6.0 


Utilice interpolación de polinomios de primero a cuarto grados para 
estimar la caída de voltaje para ¡ = 1.15. Interprete los resultados. 
20.37 Repita el cálculo para el problema 20.36, pero use regresión 
polinomial para obtener ecuaciones de mejor ajuste de grados 1 a 4 
con el uso de todos los datos. Grafique y evalúe sus resultados. 
20.38 Se mide con gran precisión la corriente en un conductor como 
función del tiempo: 


0.1250 
6.24 


0.2500 0.3750 


4.85 


0.5000 
0.0000 


7.75 


Determine el valor de ¡ en £= 0.23. 
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20.39 Los datos siguientes se tomaron de un experimento para medir la 
corriente en un conductor para varios voltajes aplicados: 


vv | 2 3 4 5 7 10 
LA | 5.2 7.8 10.7 13 19.3 27,5 


a) Sobre la base de una regresión lineal de estos datos, determine la 
corriente para un voltaje de 3.5 V. Grafique la línea y los datos, 
y evalúe el ajuste. 

b) Repita la regresión y fuerce la intersección para que sea cero. 

20.40 Se sabe que la caída de voltaje a través de un inductor sigue 

la ley de Faraday: 


donde V, es la caída del voltaje (en volts), L es la inductancia (en 
henrys; 1H =1V - s/A) e ¡es la corriente (en amperes). Emplee los 
datos siguientes para estimar £: 


di/dt, Als 
Y, V 


[1 2 4 6 8 10 
| 5,5 125 175 32 38 49 


¿Cuál es el significado, si hubiera alguno, de la intersección de la 
ecuación de regresión que se obtiene con estos datos? 

20.41 La ley de Ohm establece que la caída de voltaje V a través de 
un resistor ideal es linealmente proporcional a la corriente ¿ que 
fluye a través del resistor, como en V= ¿R, donde R es la resistencia. 
Sin embargo, los resistores reales no siempre obedecen a la ley de 
Ohm. Suponga usted que lleva a cabo algunos experimentos muy 
precisos para medir la caída de voltaje y la corriente correspondien- 
te para un resistor. Los resultados, que se enlistan en la tabla P20.41, 
sugieren una relación curvilínea, más que la línea recta que repre- 
senta la ley de Ohm. A fin de cuantificar dicha relación debe ajustar- 
se una curva a los datos. Debido al error en la medición, es común 
que la regresión sea el método preferido de ajuste de curvas para 
analizar dichos datos experimentales. Sin embargo, la suavidad de la 
relación, así como la precisión de los métodos experimentales, su- 
gieren que quizá sería apropiada la interpolación. Utilice la interpo- 
lación de polinomios de Newton para ajustar los datos y calcular V 
para ¡= 0.10. ¿Cuál es el grado del polinomio que se usó para gene- 
rar los datos? 


Tabla P20.41 Datos experimentales para la caída del 
voltaje a través de un resistor sujeto a 


distintos niveles de corriente. 


¡ | 2 =1 0.5 0.5 1 2 


V | 637 965  -205 20.5 96.5 637 


20.42 Repita el problema 20.41, pero determine los coeficientes del 
polinomio (véase la sección 18.4) que se ajusta a los datos de la tabla 
P20.41. 

20.43 Se realiza un experimento para determinar la elongación 
porcentual de un material conductor de electricidad como función de 
la temperatura. Los datos que resultan se presentan en seguida. Pre- 
diga la elongación porcentual para una temperatura de 400*C. 


Temperatura, *C | 200 250 300 375 425 475 600 
% de elongación | 75 86 87 10 113 127 


15.3 


20.44 Es frecuente que en los análisis avanzados de ingeniería surjan 
funciones de Bessel, como en el estudio de campos eléctricos. Dichas 
funciones por lo general no son susceptibles de evaluarse en forma 
directa y, por ello, no es raro que estén compiladas en tablas mate- 
máticas estándar. Por ejemplo, 


Xx | 1.8 2 2.2 2.4 2.6 
J, (x) | 0.5815 0.5767 0.556 0.5202 0.4708 


Estime J,(2.1), a) con el uso de un polinomio de interpolación y b) 
con trazadores cúbicos. Observe que el valor verdadero es 0.568292. 
20.45 La población (p) de una comunidad pequeña en los suburbios 
de una ciudad crece con rapidez durante un periodo de 20 años: 


2: 5 10 15 20 
P | 100.200 450 950 2000 


Como ingeniero que trabaja para una compañía de infraestructura, 
el lector debe pronosticar la población que habrá dentro de 5 años a 
fin de anticipar la demanda de energía. Emplee un modelo exponen- 
cial y regresión lineal para efectuar dicha predicción. 


Ingeniería mecánica/aeroespacial 

20.46 Con base en la tabla 20.4, utilice interpolación lineal y cua- 
drática para calcular el valor de O para D = 1.23 ft y S = 0.001 ft/ft. 
Compare sus resultados con el mismo valor calculado con la fórmu- 
la que se obtuvo en la sección 20.4. 

20.47 Reproduzca la sección 20.4, pero desarrolle una ecuación para 
predecir la pendiente como función del diámetro y flujo. Compare 
sus resultados con los de la fórmula de la sección 20.4 y analice su 
respuesta. 

20.48 La viscosidad dinámica del agua u(107 N - s/m?) se relaciona 
con la temperatura 7(*C), de la manera siguiente: 


T | 0 5 10 20 30 40 
7 | 1.787 1.519 1.307 1.002 0.7975 0.6529 


a) Grafique los datos. 
b) Use interpolación para predecir u con T="7.5*C. 
c) Emplee regresión polinomial para ajustar una parábola a los 
datos a fin de hacer la misma predicción. 
20.49 La Ley de Hooke, que se cumple cuando un resorte no se es- 
tira más allá de cierto límite, significa que la extensión de este resor- 
te y la fuerza que se le aplica están relacionadas linealmente. La 
proporcionalidad está parametrizada por la constante k del resorte. 
Un valor para dicho parámetro se establece en forma experimental 
con la colocación de pesos conocidos en el resorte y la medición de 
la compresión que resulta. Tales datos aparecen en la tabla P20.49 y 
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Desplazamiento, m 


Figura P20.49 
Gráfica de la fuerza (en 10% newtons) versus el desplazamiento (en 
metros) para el resorte del sistema de suspensión del automóvil. 


están graficados en la figura P20.49. Observe que por arriba de un 
peso de 40 x 10% N, la relación lineal entre la fuerza y el desplaza- 
miento desaparece. Esta clase de comportamiento es común de lo 
que se denomina “resorte endurecido”. Emplee regresión lineal para 
determinar un valor de k para la parte lineal de este sistema. Además, 
ajuste una relación no lineal a la parte no lineal. 

20.50 Repita el problema 20.49 pero ajuste una curva de potencias a 
todos los datos de la tabla P20.49. Comente sus resultados. 

20.51 La distancia que se requiere para detener un automóvil con- 
siste en componentes tanto de pensamiento como de frenado, cada 
una de las cuales es función de la velocidad. Se recabaron los siguien- 
tes datos experimentales para cuantificar dicha relación. Desarrolle 
la ecuación de mejor ajuste para ambos componentes, pensamiento 
y frenado. Utilice estas ecuaciones para estimar la distancia total en 
que se detiene un auto que viaja a 110 km/h. 


Velocidad, km/h 30 45 60 75 90 120 
Pensamiento, m 5.6 8.5 11.1 14.5 16.7 22.4 
Frenado, m 5.0 12.3 21.0 32.9 47.6 84.7 


20.52 Se realiza un experimento para definir la relación entre el 
esfuerzo aplicado y el tiempo para que se fracture cierto tipo de 
acero inoxidable. Se aplican ocho valores distintos de esfuerzo, y los 
datos resultantes son 


5 10 15 20 25 30 35 40 


18 20 22 15 


Esfuerzo aplicado, x, kg/mm? 


Tiempo para la fractura, y, h | 40 30 25 40 


Tabla P20.49 Valores experimentales para la elongación x y la fuerza F para el 
resorte de un sistema de suspensión de automóvil 


Desplazamiento, m | 0.10 0.17 0.27 0.35 0.39 


0.42 0.43 0.44 


Fuerza, 10%N | 10 20 30 40 50 


60 70 80 
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Grafique los datos y después desarrolle la ecuación de mejor ajuste 
para predecir el tiempo de fractura para un esfuerzo aplicado de 20 
kg/mn?. 

20.53 La aceleración debida a la gravedad a una altitud y por encima 
de la superficie de la Tierra está dada por 


30000 
9.7487 


60000 
9.6879 


90000 
9.6278 


120000 
9.5682 


y, m | 0 
9, mis? | 9.8100 


Calcule g para y = 55000 m. 

20.54 De un procedimiento de prueba se obtuvieron la tasa de arras- 
tre e que es la tasa de tiempo a que aumenta la tensión, y de esfuerzos, 
los cuales se presentan a continuación. Con el uso de una ley de 
curva de potencias para ajustar, 


£=B0 


encuentre el valor de B y m. Grafique sus resultados con el empleo 
de una escala log-log. 


0.0004 0.0011 0.0021 0.0031 


Tasa de arrastre, min”! 


Esfuerzo, MPa 5:75 8.577 10.874 12.555 


20.55 Al examinar el comportamiento viscoso de un fluido es práctica 
común graficar la tasa de corte (gradiente de velocidad) 


dv. 
ra 


en las abscisas versus el esfuerzo cortante (Tr) en las ordenadas. 
Cuando un fluido muestra un comportamiento en línea recta entre 
esas dos variables, se denomina fluido newtoniano, y la relación re- 
sultante es 


T=uY 


donde u es la viscosidad del fluido. Muchos fluidos comunes siguen 
este comportamiento como el agua, leche y aceite. Los fluidos que 
no se comportan de esa manera, se llaman no newtonianos. En la 


Esfuerzo cortante (7) 


Deformación cortante (m/ 


Figura P20.55 
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figura P20.55 se muestran algunos ejemplos de fluidos no newto- 
nianos. 

Para plásticos Bingham, hay un esfuerzo inducido 7, que debe 
superarse para que el flujo comience, 


T=T,+HY 


Un ejemplo común es la pasta de dientes. 
Para fluidos pseudoplásticos o “fluidificados por esfuerzo cor- 
tante”, el esfuerzo cortante se eleva a la potencia n menor que uno, 


T=HY 


Fluidos como el yogurt, la mayonesa y el champú experimentan 
una disminución de viscosidad al aumentar el esfuerzo. Observe que 
para los casos en que n > 1, que se llaman fluidos dilatantes (o “espe- 
sados por esfuerzo cortante”), la viscosidad efectivamente aumenta 
al incrementar el esfuerzo. Los ejemplos incluyen almidón en agua 
y arena de playa mojada. 

Los siguientes datos muestran la relación entre el esfuerzo cortan- 
te T y la tasa de tensión cortante 7, es la cantidad de esfuerzo que se 
debe exceder antes de que comience el flujo. Encuentre la viscosidad 
u (pendiente), 7, y el valor de +? usando un método de regresión. 
¿Cuál es el tipo de fluido? 


Esfuerzo rt, N/m? | 3.25 4.25 4.65 5.65 6.05 


Tasa de tensión cortante, y, 1/s | 0.9 2.1 2.9 4.1 4.9 


20.56 La relación entre el esfuerzo 7 y la tasa de deformación cor- 
tante y para un fluido pseudoplástico (véase el problema 20.55), 
puede expresarse con la ecuación T =p". Los siguientes datos pro- 
vienen de una solución al 5% de hidroxetilcelulosa en agua. Usando 
un ajuste por ley de potencias, encuentre los valores de y y n. 


Tasa de tensión cortante, y, 1/s | 50 70 90 110 130 


| 6.01 7.48 8.59 


Esfuerzo rt, N/m? 9.19 10.21 


20.57 Se mide la velocidad u del aire que fluye a varias distancias y 
de una superficie plana. Ajuste una curva a esos datos si se supone 
que la velocidad en la superficie es igual a cero (y = 0). Utilice su 
resultado para determinar el esfuerzo cortante (u du/dy) en la super- 
ficie. (u =1.8 x 10% N - s/m?) 


| 0.002 
| 0.287 


0.006 
0.899 


0.012 
1.915 


0.018 
3.048 


0.024 
4.299 


y, m 


u, m/s 


20.58 La ecuación de Andrade ha sido propuesta como modelo del 
efecto de la temperatura sobre la viscosidad, 

=D, ¿5lTa 
donde u = viscosidad dinámica del agua (107 N - s/m?), T, = tempe- 
ratura absoluta (K), y D y B son parámetros. Ajuste este modelo a los 
datos del agua del problema 20.48. 
20.59 Desarrolle ecuaciones para ajustar los calores específicos 
ideales c, (kJ/kg - K), como función de la temperatura 7 (K), para 
varios gases, según se enlistan en la tabla P20.59. 
20.60 Se mide la temperatura en varios puntos de una placa calen- 


tada (véase la tabla P20.60). Estime la temperatura en a) x=4, y = 
3.2 y b)x=4.3,y=2.7. 


Problemas 453 
Tabla P20.59 Calores específicos ideales, c, (kJ/kg - K) como función de la temperatura para distintos gases. 
Gas 250 K 300 K 350 K 450 K 550 K 650 K 800 K 900 K 1000 K 
H> 14.051 14.307 14.427 14.501 14.53 14.571 14.695 14.822 14.983 
CO, 0.791 0.846 0.895 0.978 1.046 1.102 1.169 1.204 1.234 
O, 0.913 0.918 0.928 0.956 0.988 1.017 1.054 1.074 1.09 
N, 1.039 1.039 1.041 1.049 1.065 1.086 1.121 1.145 1.167 


Tabla P20.60 Temperaturas (”C) en varios puntos de una placa cuadrada calentada. 


x=0 x=2 x=4 x=6 x=8 
y=0 100.00 90.00 80.00 70.00 60.00 
y=2 85.00 64.49 53.50 48.15 50.00 
y=4 70.00 48.90 38.43 35.03 40.00 
y=6 55.00 38.78 30.39 27.07 30.00 
y=8 40.00 35.00 30.00 25.00 20.00 


20.61 Los datos de la página siguiente se obtuvieron de una prueba 
de arrastre que se llevó a cabo a la temperatura ambiente sobre 
un alambre compuesto de 40% de hojalata, 60% de plomo y un núcleo 
sólido soldado. Esto se realizó por medio de la medición del incre- 
mento en la tensión durante el tiempo mientras se aplicaba una carga 
constante a un espécimen de prueba. 


Con un método de regresión lineal, encuentre a) la ecuación de 
la línea que mejor ajuste los datos y b) el valor de »?. Grafique sus 
resultados. ¿La línea que pasa por el origen —es decir, en el tiempo 
cero— debe tener alguna tensión? Si la línea no pasa por el origen, 
fuércela a hacerlo. ¿La nueva recta representa la tendencia de los datos? 
Sugiera una ecuación nueva que satisfaga la tensión igual a cero en 
el tiempo igual a cero, y también represente la tendencia de los datos. 


0.085 


Tiempo, Tensión, Tiempo, 

min % min 
0.10 3.589 

0.586 0.13 4.089 
1.086 0.16 4.590 
1.587 0.18 5.090 
2.087 0.20 5.591 
2.588 0.23 6.091 
3.088 0.25 6.592 


Tensión, Tiempo, Tensión, 
% min % 
0.26 7.092 0.43 
0.30 7.592 0.45 
0.32 8.093 0.47 
0.34 8.593 0.50 
0.37 9.094 0.52 
0.39 9.594 0.54 
0.41 10.097 0.56 


EPÍLOGO: PARTE CINCO 


PT5.4 ALTERNATIVAS 


La tabla PT5.4 ofrece un resumen de las ventajas y las desventajas de los métodos para el ajuste de 
curvas. Las técnicas se dividen en dos grandes categorías, según sea la incertidumbre de los datos. 
Para mediciones imprecisas la regresión se utiliza para desarrollar una curva que “mejor” se ajuste 
a la tendencia global de los datos, sin que necesariamente pase a través de alguno de los puntos. Para 
mediciones precisas se usa la interpolación para desarrollar una curva que pase justo a través de los 
puntos. 

Todos los métodos de regresión están diseñados para ajustar funciones que minimicen la suma 
de los cuadrados de los residuos entre los datos y la función. Tales métodos se denominan de regre- 
sión por mínimos cuadrados. La regresión lineal por mínimos cuadrados se usa para casos donde 
una variable dependiente y otra independiente se relacionan entre sí en forma lineal. Para situaciones 
donde una variable dependiente y una independiente exhiben un comportamiento curvilíneo, hay 
varias opciones disponibles. En algunos casos, se emplean transformaciones para linealizar el com- 
portamiento. En estos casos, se aplica una regresión lineal a las variables transformadas con el 
propósito de determinar la mejor línea recta. De manera alternativa, la regresión polinomial se uti- 
liza para ajustar una curva directamente a los datos. 

La regresión lineal múltiple se utiliza cuando una variable dependiente es una función lineal de 
dos o más variables independientes. Las transformaciones logarítmicas también se aplican a este 
tipo de regresión en aquellos casos donde la dependencia múltiple es curvilínea. 

La regresión polinomial y la lineal múltiple (observe que la regresión lineal simple es una par- 
ticularidad de ambas) pertenecen a una clase más general de modelos de mínimos cuadrados linea- 
les. Se clasifican de esta manera porque son lineales respecto a sus coeficientes. Por lo común estos 
modelos se implementan a través de la solución de sistemas algebraicos lineales, que algunas veces 
están mal condicionados. Sin embargo, en muchos problemas de ingeniería (se tienen ajustes de 
grado inferior), afortunadamente, no ocurre. En los casos donde esto represente un problema se 
cuenta con algunos procedimientos alternativos. Por ejemplo, existe una técnica llamada de polino- 
mios ortogonales, para realizar la regresión polinomial (véase la sección P'T5.6). 

Las ecuaciones que no son lineales respecto a sus coeficientes se denominan no lineales. Hay 
técnicas de regresión especiales para ajustar tales ecuaciones. Éstos son métodos aproximados que 


Tabla PT5.4 Comparación de las características de los diferentes métodos para el ajuste de curvas. 


Núm. de puntos 


Error Coincidencia 
asociado  conlos datos que coinciden Dificultad de 
Método con datos individuales exactamente programación Comentarios 
Regresión 
Regresión lineal Grande Aproximada 0 Fácil 
Regresión polinomial Grande Aproximada 0 Moderada El error de redondeo 
se vuelve pronunciado 
en versiones de grado 
superior 
Regresión lineal múltiple Grande Aproximada 0 oderada 
Regresión no lineal Grande Aproximada 0 Difícil 
Interpolación 
Polinomios de Newton 
en diferencias divididas Pequeña Exacta n+1 Fácil Se prefiere para análisis 
exploratorios 
Polinomios de Lagrange Pequeña Exacta n+1 Fácil Se prefiere cuando se conoce 
el grado 
Trazadores cúbicos Pequeña Exacta Ajuste por segmentos a los oderada Primera y segunda derivadas 


puntos asociados con datos iguales en nodos 


PT5.6 Métodos avanzados y referencias adicionales 


empiezan con un parámetro inicial estimado y después, iterativamente, llegan a valores que mini- 
mizan la suma de los cuadrados. 

La interpolación polinomial está diseñada para ajustar un único polinomio de n-ésimo grado que 
pasa exactamente a través de los n + 1 puntos que se tienen como datos. Este polinomio se presenta en 
dos formas alternativas. La interpolación polinomial de Newton en diferencias divididas es ideal 
en aquellos casos donde se conoce el grado del polinomio. El polinomio de Newton resulta apropiado en 
tales situaciones, ya que se programa en forma sencilla en un formato que sirve para comparar resulta- 
dos con diferentes grados. Además, un error estimado simplemente se puede incorporar en la técnica. 
Así, usted puede comparar y elegir de los resultados usando varios polinomios de diferente grado. 

La interpolación de polinomios de Lagrange es una forma alternativa que es conveniente cuan- 
do el grado se conoce de antemano. En dichas situaciones, la versión de Lagrange es más fácil de 
programar y no requiere del cálculo ni el almacenamiento de diferencias finitas divididas. 

Otro procedimiento para ajustar curvas es la interpolación mediante trazadores. Esta técnica ajusta 
un polinomio de grado inferior para cada intervalo entre los puntos dados. El ajuste se suaviza igualando 
las derivadas de polinomios adyacentes al mismo valor en sus puntos de unión. Los trazadores cúbicos 
son el modelo más común. Los trazadores son de gran utilidad cuando se ajustan a datos que por lo ge- 
neral son suaves; pero que exhiben áreas locales de cambio abrupto. Tales datos tienden a inducir osci- 
laciones desordenadas cuando se interpolan polinomios de grado superior. Los trazadores cúbicos son 
menos propensos a esas oscilaciones debido a que están limitados a variaciones de tercer grado. 

Más allá del caso unidimensional, se puede implementar interpolación para datos multidimen- 
sionales. Tanto los polinomios de interpolación como los trazadores se pueden usar para este propó- 
sito. Hay paquetes de software disponibles para agilizar tales aplicaciones. 

El último método que se estudia en esta parte del libro es la aproximación de Fourier, la cual 
trata con el uso de funciones trigonométricas para aproximar diversas formas de ondas. En contras- 
te con las otras técnicas, el mayor énfasis de este procedimiento no es ajustar una curva a los datos; 
sino que el ajuste de la curva se emplee para analizar las frecuencias características de una señal. En 
particular, la transformada rápida de Fourier permite transformar eficientemente una función del 
dominio del tiempo al de la frecuencia, para entender su estructura armónica. 


PT5.5 RELACIONES Y FÓRMULAS IMPORTANTES 


La tabla PT5S.5 resume información importante que se presentó en la parte cinco. Esta tabla se pue- 
de consultar para tener un rápido acceso a las relaciones y las fórmulas importantes. 


PT5.6 MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES 


Aunque la regresión polinomial con ecuaciones normales es adecuada para muchos problemas de 
ingeniería, hay contextos de problemas donde su sensibilidad a los errores de redondeo presenta 
serias limitaciones. Un procedimiento alternativo basado en polinomios ortogonales puede disminuir 
esos efectos. Deberá observarse que este procedimiento no da una ecuación de mejor ajuste, sino 
más bien predicciones individuales para valores dados de la variable independiente. Se recomienda 
consultar a Shampine y Allen (1973) y Guest (1961) para mayor información acerca de los polinomios 
ortogonales. 

Mientras que la técnica de polinomios ortogonales es útil para desarrollar una regresión poli- 
nomial, no representa una solución al problema de inestabilidad para el modelo de regresión lineal 
general [ecuación (17.23)]. Hay un procedimiento alternativo basado en la descomposición de valo- 
res singulares, llamado método SVD, para dicho propósito. Información sobre este procedimiento 
se encuentra en Forsythe y colaboradores (1977), Lawson y Hanson (1974), y Press y colaboradores 
(1992). 

Además del algoritmo de Gauss-Newton, existen varios métodos de optimización que se utilizan 
de manera directa con la finalidad de desarrollar un ajuste por mínimos cuadrados para una ecuación 
no lineal. Dichas técnicas de regresión no lineal incluyen los métodos de máximo descenso y de 
Marquardt (recuerde la parte cuatro). Para mayor información sobre regresión consulte a Draper y 
Smith (1981). 
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Epílogo: parte cinco 


Tabla PT5.5 Resumen de la información importante presentada en la parte cinco. 


Interpretación 


Método Formulación Errores 
Regresión lineal y=ap, + ax S 
nExy Nx Yy Ss = 
donde a, = A : zd 1 NN n-2 
nx (2 x) 
E t ? S,-S, 
d=Y- ax _ Ss 
Regresión Y=29 + MX ++ ax" y Ss 
polinomial (Evaluación de las a equivalente LA Sy ——— 
a la solución de m + 1 ecuaciones sn * n-(m+%) 
algebraicas lineales) 
E 2 S, -S, 
x r”= 
S, 
Regresión lineal múltiple. y=a,¿+ aX; ++ dyXm Ss 
(Evaluación de las a equivalentes Su = —— 
a la solución de m + 1 ecuaciones n=(m +1) 
algebraicas lineales) 
S.-S 
r Eat. r 
S, 
Interpolación polinomial B(x) = bo + bi (x—X0) + box — XX — X1) A fp S) 
p p 2 o +01 0 2 0 1 R, = (x= x MX xx x,) 
de Newton en diferencias donde by = f(Xo) GAN 
divididas* by =Flx,, xo] e 
b) = FlX2, X1, Xol al Ra = (— xo) — xa) — X2)F[X3, X2, X1, Xo] 


Interpolación 
polinomial de 
Lagrange* 


Trazadores cúbicos 


E al y 3) 

£09= 1) E [2 R =p aa 
XX, x,=X, 
xXx = 0) 

mx) 2 E 
xXx -x, Ra = (x— xo) — Xx — X2)Í 3, X2, X1, Xol 
x=Xx, (xx 
+10) o 

IS 

Una cúbica: Y ab +0 xd, 

apó + bp0 + cx + d; Y nodo 


se ajusta a cada intervalo entre nodos. 
Primera y segunda derivadas son 


3 2 
iguales en cada nodo 49X7 + b3x" + C,X + d, 


> 


Xx 


* Nota: Para simplificar, se muestran las versiones de segundo grado. 


Todos los métodos de la parte cinco se estudiaron en términos de ajuste de curvas a datos. Además, 
quizá usted desee ajustar una curva a otra. El motivo principal de tal aproximación funcional es la 
representación de una función complicada mediante una versión más simple que sea más fácil de 
manipular. Una manera de hacerlo consiste en usar la función complicada para generar una tabla 
de valores. Después, las técnicas analizadas en esta parte del libro pueden usarse para ajustar polino- 
mios a estos valores discretos. 


PT5.6 Métodos avanzados y referencias adicionales 


Un procedimiento alternativo se basa en el principio minimax (véase la figura 17.2c). Este 
principio especifica que los coeficientes de la aproximación polinomial deben elegirse de tal forma 
que la discrepancia máxima sea lo más pequeña posible. Así, aunque la aproximación no sea tan 
buena como la que ofrece la serie de Taylor en el punto base, por lo general es mejor en todo el in- 
tervalo del ajuste. La economización de Chebyshev es un ejemplo de un procedimiento para una 
aproximación funcional basada en tal estrategia (Ralston y Rabinowitz, 1978; Gerald y Wheatley, 
2004, y Carnahan, Luther y Wilkes, 1969). 

Una alternativa importante en el ajuste de curvas es la combinación de trazadores con una re- 
gresión por mínimos cuadrados. Así, se genera un trazador cúbico de tal forma que no intercepte 
todos los puntos, pero que minimice la suma de los cuadrados de los residuos entre los datos y los 
trazadores. El procedimiento usa los denominados trazadores B como funciones base; se nombran 
así debido a su empleo como función base, y también por su forma de campana (bell) característica. 
Tales curvas son consistentes con un procedimiento de trazadores, puesto que la función y su pri- 
mera y segunda derivadas serán continuas en los extremos. De esta forma se asegura la continuidad 
de f(x) y sus derivadas en los nodos. Wold (1974), Prenter (1975) y Cheney y Kincaid (2008) ofrecen 
un análisis de tal procedimiento. 

En resumen, con lo anterior se intenta proporcionarle alternativas para la exploración más pro- 
funda del tema. Asimismo, todas las referencias anteriores proporcionan descripciones de las técni- 
cas básicas tratadas en la parte cinco. Le recomendamos consultar esas fuentes alternas para ampliar 
su comprensión de los métodos numéricos para el ajuste de curvas. 
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PARTE SEIS 


DIFERENCIACIÓN E INTEGRACIÓN 
NUMÉRICAS 


PT6.1 MOTIVACIÓN 


El cálculo es la matemática del cambio. Como los ingenieros deben tratar en forma continua con 
sistemas y procesos que cambian, el cálculo es una herramienta esencial en nuestra profesión. En 
la esencia del cálculo están dos conceptos matemáticos relacionados: la diferenciación y la inte- 
gración. 

De acuerdo a la definición del diccionario, diferenciar significa “marcar por diferencias; dis- 
tinguir;... percibir la diferencia en o entre”. En el contexto de las matemáticas, la derivada sirve 
como el principal vehículo para la diferenciación, representa la razón de cambio de una variable 
dependiente con respecto a una variable independiente. Como se ilustra en la figura PT6.1, la defi- 
nición matemática de la derivada empieza con una aproximación por diferencias: 


Ay _ f(x, + Ax) f(x) (PT6.1) 
Ar Ax 


donde y y f(x) son representaciones alternativas de la variable dependiente y x es la variable inde- 
pendiente. Si se hace que Ax se aproxime a cero, como sucede en los movimientos mostrados desde 
la figura PT6.1a a la PT6.1c, el cociente de las diferencias se convierte en una derivada 

dy 


= — lím Fo; + Ax)- £(x;) 
dx Ax>50 Ax 


donde dy/dx [que también se denota como y” o f'(x,)] es la primera derivada de y con respecto a x 
evaluada en x, Como se observa en la descripción visual de la figura PT6.1c, la derivada evaluada 
es la pendiente de la recta tangente a la curva en x.. 


JA Yi yA 
f(4 + Ax) 
A 
d f(x + Ax) | 
Ay 
10) 
10%) 10) 
Xx Xx + Ax x Xx XA +HAx x x 
AE =p 
Ax Ax 
a) b) c) 
Figura PT6.1 


La definición gráfica de una derivada: conforme Ax se aproxima a cero al ir de a) a dC), la aproximación 
por diferencias se va convirtiendo en una derivada. 
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Parte 6 Diferenciación e integración numéricas 


La segunda derivada representa la derivada de la primera 
derivada 


d?y d (dy 

dx? dx (2) 
Así, la segunda derivada expresa la rapidez de cambio de la pen- 
diente. Con frecuencia se le llama la curvatura, porque un alto 
valor de la segunda derivada significa alta curvatura. 

Finalmente, para funciones que dependen de más de una 
variable, se usan las derivadas parciales. Se puede pensar que 
éstas toman la derivada de la función en un punto manteniendo 
constantes todas las variables excepto una. Por ejemplo, dada una 
función f que depende tanto de x como de y, la derivada parcial 

A de fcon respecto a x en un punto arbitrario (x, y) se define como 


Figura PT6.2 


b EN 


$ FU+Ax, y) — f(x, y) 
== im 


Ox — Ax>0 Ax 


Representación gráfica de la integral de f(x) entre los lími- Del mismo modo, la derivada parcial de f con respecto a y se 
tes x= a y x= b. La integral es equivalente al área bajo la define como 


curva. 


9f _ lím FO y RAY FE, Y) 
dy = Ay>0 Ay 


Para adquirir una comprensión intuitiva de las derivadas parciales, reconozca que una función 
que depende de dos variables es una superficie más que una curva. Suponga que usted está escalan- 
do una montaña y tiene acceso a una función f que da la elevación como función de la longitud (el 
eje x, con orientación este-oeste) y la latitud (el eje y, con orientación norte-sur). Si usted se detiene 
en un punto determinado (x,, y,), la pendiente al este sería of Eo y ,)/0x, y la pendiente al norte sería 
Oy» Y Oy. 

En cálculo, el proceso inverso de la diferenciación es la integración. De acuerdo con la definición 
del diccionario, integrar significa “juntar partes en un todo; unir; indicar la cantidad total ...”. Ma- 
temáticamente, la integración se representa por 


[= j j Fx) dx (PT6.2) 


que representa la integral de la función f(x) con respecto a la variable independiente x, evaluada entre 
los límites x = a y x = b. La función f(x) en la ecuación (PT6.2) se llama integrando. 

Como lo sugiere la definición del diccionario, el “significado” de la ecuación (PT6.2) es el valor 
total, o sumatoria, de f(x) dx sobre el intervalo desde x = a hasta x = b. De hecho, el símbolo Jes en 
realidad una letra $ mayúscula estilizada, que intenta representar la estrecha relación entre integra- 
ción y suma. 

La figura PT6.2 representa una manifestación gráfica del concepto. Para funciones que están 
por encima del eje x, la integral, expresada por la ecuación (PT6.2) corresponde al área bajo la 
curva de f(x) entre x=a y b.' 

Como se dijo antes, la “distinción” o “discriminación” de la diferenciación y el “juntar” de la 
integral son procesos estrechamente relacionados, de hecho, inversamente relacionados (figura PT6.3). 
Por ejemplo, si se tiene una función dada y(1) que especifica la posición de un objeto en función del 
tiempo, la diferenciación proporciona un medio para determinar su velocidad (figura PT6.3a), 


y E 
UD = 10 


¡Deberá observarse que el proceso representado por la ecuación (PT6.2) y la figura PT6.2 se conoce como integración definida. 
Hay otro tipo que se denomina integración indefinida, en la cual no se especifican los límites a y b. Como se analizará en la 
parte siete, la integración indefinida se ocupa de la determinación de una función, de la que se da su derivada. 
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Figura PT6.3 
El contraste entre a) diferenciación y b) integración. 


De manera inversa, si se tiene la velocidad como una función del tiempo, la integración se utilizará 
para determinar su posición (figura PT6.3b), 


y(t) = f v(t) dt 


Así, se dice de manera general que la evaluación de la integral 


f= f f6) dx 


es equivalente a resolver la ecuación diferencial 
dy 
=P 
dx 


para y(b) dada la condición inicial y(a) = 0. 

Debido a esa estrecha relación, optamos por dedicar esta parte del libro a ambos procesos. 
Entre otras cuestiones, esto ofrecerá la oportunidad de resaltar tanto sus similitudes como sus dife- 
rencias desde una perspectiva numérica. Además, nuestro análisis tendrá relevancia en las siguientes 
partes del libro, donde se estudiarán las ecuaciones diferenciales. 


PT6.1.1 Métodos sin computadora para diferenciación e integración 


La función que va a diferenciarse o integrarse estará, usualmente, en una de las siguientes tres formas: 


1. Una función continua simple como un polinomio, una función exponencial o una función trigo- 
nométrica. 

2. Una función continua complicada que es difícil o imposible de diferenciar o integrar directamente. 

3. Una función tabulada donde los valores de x y f(x) están dados como un conjunto discreto de 
puntos, lo cual es el caso cuando se tienen datos experimentales o de campo. 
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Diferenciación por áreas iguales. a) 


dy/dx Se usan las diferencias divididas cen- 
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a) 


76.50 tradas para estimar la derivada 
57.50 en cada intervalo entre los puntos 
asociados con los datos. b) Las esti- 
45.00 maciones de la derivada se represen- 
36.25 tan en forma de gráfica de barras. 
Se superpone una curva suave sobre 
25.00 esta gráfica para aproximar el área 
21.50 bajo la gráfica de barras. Esto se 
lleva a cabo al dibujar la curva de tal 
forma que áreas iguales positivas y 
negativas estén equilibradas. c) En- 
tonces, es posible leer los valores de 
b) 0) dyldx de la curva suave. 


50 
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En el primer caso, la derivada o la integral de una función simple se puede evaluar analítica- 
mente usando el cálculo. En el segundo caso, las soluciones analíticas a menudo no son fáciles e 
incluso algunas veces son imposibles de obtener. En tales situaciones, así como en el tercer caso de 
datos discretos, se deberán emplear métodos aproximados. 

Un método sin computadora para determinar las derivadas a partir de datos se conoce como 
diferenciación gráfica por áreas iguales. En este método los datos (x, y) se tabulan y, para cada in- 
tervalo, se emplea una diferencia dividida simple Ay/Ax para estimar la pendiente. Después, esos 
valores se grafican como una curva escalonada contra x (figura PT6.4). Luego se dibuja una curva 
suave que trata de aproximar el área bajo la curva escalonada. Es decir, se dibuja de manera que las 
áreas negativas y positivas se equilibren visualmente. Entonces, las razones para valores dados de x 
pueden leerse en la curva. 

De esta misma manera, se utilizaron procedimientos visual- 
mente orientados para integrar datos tabulados y funciones com- 
plicadas, antes de la llegada de la computadora. Un procedimiento 


intuitivo simple consiste en graficar la función sobre una cuadrí- 


Fo) 


cula (figura PT6.5) y contar el número de cuadros que se aproxi- 
men al área. Este número multiplicado por el área de cada cuadro 
proporciona una burda estimación del área total bajo la curva. 


Dicha estimación se puede mejorar, a expensas de mayor trabajo, 


usando una cuadrícula más fina. 
Otro procedimiento de sentido común es dividir el área en 


segmentos verticales, o barras, con una altura igual al valor de 


la función en el punto medio de cada barra (figura PT6.6). Des- 


pués, el área de los rectángulos se calcula y se suma para estimar 
el área total. En este procedimiento se supone que el valor en el 


punto medio de la barra ofrece una aproximación válida de la 


altura promedio de la función en cada barra. Como en el método 


de la cuadrícula, es posible mejorar las estimaciones al usar más 
barras (y en consecuencia más delgadas) para aproximar la in- 
x tegral. 


Figura PT6.5 
Uso de una cuadrícu 


Aunquetales procedimientos tienen utilidad para estimaciones 
rápidas, existen técnicas numéricas alternativas con el mismo 
propósito. No es de sorprender entonces que los más simples de 
a para aproximar una integral. estos métodos sean similares, en esencia, alas técnicas sin compu- 
tadora. 


Para la diferenciación, las técnicas numéricas fundamentales 
utilizan divididas diferencias finitas para estimar las derivadas. Para 
datos con error, un procedimiento alternativo consiste en ajustar a 
los datos una curva suave con una técnica como la de regresión por 
mínimos cuadrados y luego derivar esta curva para obtener las esti- 
maciones correspondientes. 

De la misma forma, se dispone de integración numérica o de mé- 
todos de cuadratura para obtener integrales. Dichos métodos, que, de 
hecho, son más fáciles de implementar que el método de la cuadrícula, 
son similares en esencia al método por barras. Es decir, las alturas de 
la función se multiplican por el ancho de las barras y se suman para 
estimar la integral. Sin embargo, mediante una elección inteligente de 
los factores ponderantes, la estimación resultante se puede hacer más 
exacta que con el “método de barras” simple. 

Como en el método de barras simple, las técnicas numéricas de 
integración y diferenciación utilizan datos de puntos discretos. Como 
cierta información ya está tabulada, naturalmente es compatible con 
muchos de los métodos numéricos. Aunque las funciones continuas 
no están originalmente en forma discreta, a menudo resulta sencillo 
emplear las ecuaciones dadas para generar una tabla de valores. Como 
se ilustra en la figura PT6.7, esta tabla puede, entonces, evaluarse con 
un método numérico. 


PT6.1.2 Diferenciación e integración numérica 
en ingeniería 


La diferenciación e integración de una función tiene tantas aplicacio- 
nes en la ingeniería que usted tuvo que estudiar cálculo diferencial e 
integral en su primer año de estudios superiores. Se podrían dar mu- 
chos ejemplos específicos de tales aplicaciones en todos los campos 
de la ingeniería. 

La diferenciación es algo común en ingeniería a causa de que 
mucho de nuestro trabajo implica analizar los cambios de las variables, 
tanto en el tiempo como en el espacio. De hecho, muchas de las leyes, 
y Otras generalizaciones que aparecen constantemente en nuestro 
trabajo, se basan en las maneras predecibles donde el cambio se ma- 
nifiesta en el mundo físico. Un ejemplo importante es la segunda ley 
de Newton, que no se expresa en términos de la posición de un objeto, 
sino más bien en el cambio de la posición con respecto al tiempo. 

Además de este ejemplo que involucra el tiempo, numerosas leyes 
que gobiernan el comportamiento de las variables en el espacio se 
expresan en términos de derivadas. Entre las más comunes figuran 
las leyes que consideran potenciales o gradientes. Por ejemplo, la ley 
de Fourier de la conducción de calor cuantifica la observación de 
que el calor fluye desde regiones de mayor a menor temperatura. En 
el caso unidimensional, ésta se expresa en forma matemática como: 


Figura PT6.7 

Aplicación de un método de integración numérico: a) Una función 
continua complicada. b) Tabla de valores discretos de f(x) generados 
a partir de la función. c) Uso de un método numérico (el método de 
barras) para estimar la integral basándose en puntos discretos. En una 
función tabulada, los datos ya están en esta forma b); por lo tanto, el 
paso a) no es necesario. 
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Figura PT6.6 
El empleo de rectángulos, o barras, para aproximar la 
integral. 
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A] 


Figura PT6.8 


b) c) 


Ejemplos de cómo se utiliza la integración para evaluar áreas en problemas de ingeniería. a) Un topógrafo podría necesitar saber 
el área de un campo limitado por una corriente zigzagueante y dos caminos. b) Un ingeniero en hidráulica tal vez requiera cono- 
cer el área de la sección transversal de un río. c) Un ingeniero en estructuras quizá necesite determinar la fuerza neta ejercida por 
un viento no uniforme que sopla contra un lado de un rascacielos. 


Flujo de calor =-—k?* E 
x 


Así, la derivada proporciona una medida de la intensidad del cambio de temperatura, o gradiente, que 
ocasiona la transferencia de calor. Leyes similares proporcionan modelos prácticos en muchas áreas 
de la ingeniería, entre ellos se incluyen el modelado de dinámica de fluidos, la transferencia de masa, 
la cinética de las reacciones químicas y el flujo electromagnético. La habilidad para estimar de mane- 
ra exacta las derivadas es una cualidad importante de nuestra capacidad para trabajar de manera efi- 
ciente en estas áreas. 

Así como las estimaciones exactas de las derivadas son importantes en ingeniería, también el 
cálculo de integrales es igualmente valioso. Hay varios ejemplos relacionados directamente con la 
idea de la integral como el área bajo la curva. La figura PT6.8 ilustra algunos casos donde se usa 
la integración con este propósito. 

Otras aplicaciones comunes relacionan la analogía entre integración y sumatoria. Por ejemplo, 
un problema común es determinar la media de funciones continuas. En la parte cinco se presentaron 
los conceptos de la media de n datos discretos [recuerde la ecuación PTS5.1]: 


yy, 


Media= = (PT6.3) 
n 


donde y, son las mediciones individuales. La determinación de la media para datos discretos se 
ilustra en la figura PT6.9a. 

En contraste, suponga que y es una función continua de una variable independiente x, como se 
ilustra en la figura PT6.9b. En este caso existe un número infinito de valores entre a y b. Como la 
ecuación (PT6.3) se aplica para determinar la media de lecturas discretas, usted podría interesarse 
también en calcular la media o promedio de la función continua y = f(x) en el intervalo de a a b. La 
integración se utiliza con este propósito, como lo especifica la fórmula 


b 
j FG) dx 
Media = H——— (PT6.4) 
=a 
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Esta fórmula tiene cientos de aplicaciones en ingeniería. Por 
ejemplo, sirve para calcular el centro de gravedad de objetos 
irregulares en ingeniería civil y mecánica, y para determinar la 
raíz media cuadrática de la corriente en ingeniería eléctrica. 

Las integrales también se utilizan para evaluar la cantidad 
total de una variable física dada. La integral se puede evaluar 
sobre una línea, un área o un volumen. Por ejemplo, la masa total 
de una sustancia química contenida en un reactor está dada por 
el producto de la concentración de la sustancia química por el 
volumen del reactor, o 


Masa = concentración x volumen 

y=f£04 

donde la concentración tiene unidades de masa por volumen. Sin 

embargo, suponga que la concentración varía de un lugar a otro 

dentro del reactor. En este caso, es necesario sumar los productos 

de las concentraciones locales c, por los correspondientes volú- 
menes elementales AV;: 


Masa = Na AV, 


i=1 


b) 


donde n es el número de volúmenes discretos. En el caso conti- 
nuo, donde c(x, y, z) es una función conocida y x, y, z son las 
variables independientes que designan la posición en coordena- 
das cartesianas, la integración se utiliza con el mismo propósito: 


Figura PT6.9 
Una ilustración de la media para datos a) discretos y 
b) continuos. 


Masa = ff ec y, 2) dx dy dz 


Masa = fffew dV 


la cual se conoce como una integral de volumen. Observe la estrecha analogía entre suma e integración. 

Casos similares podrán darse en otros campos de la ingeniería. Por ejemplo, la rapidez total de 
la transferencia de energía a través de un plano, donde el flujo (en calorías por centímetro cuadrado 
por segundo) es una función de la posición, está dada por 


Transferencia de calor = Jl Jrtujo dA 


que se denomina una integral de área, donde A = área. 
De manera similar, para el caso unidimensional, la masa total de una barra con densidad varia- 
ble, y que tiene un área de sección transversal constante, está dada por 


m=A foco dx 


donde m = masa total (kg), L = longitud de la barra (m), p (x) = densidad conocida (kg/m*) como una 
función de la longitud x (m) y A = área de la sección transversal de la barra (m?). 

Por último, las integrales se utilizan para resolver ecuaciones diferenciales. Por ejemplo, supon- 
ga que la velocidad de una partícula es una función continua conocida del tiempo v(£), 


dy 
== Í 
v(t) 


La distancia total y recorrida por esta partícula en un tiempo t está dada por (figura PT6.3b) 
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(PT6.5) 


Éstas son sólo algunas de las diversas aplicaciones de la diferenciación y la integración que usted 
podría enfrentar regularmente durante el desarrollo de su profesión. Cuando las funciones sujetas a 
análisis son simples, usted preferirá evaluarlas analíticamente. Por ejemplo, en el problema del pa- 
racaidista en caída, determinamos la velocidad como función del tiempo [ecuación (1.10)]. Esta 
relación podría sustituirse en la ecuación (PT6.5), la cual se integra con facilidad, para determinar 
la distancia que cae el paracaidista en un periodo £. En un caso así, la integral es fácil de evaluar. Sin 
embargo, es difícil, o imposible, cuando la función es complicada, como sucede en el caso de ejem- 
plos reales. Además, a menudo la función analizada se desconoce y se define, sólo por mediciones 
en puntos discretos. En ambos casos, usted debe tener la habilidad de obtener valores aproximados 
para las derivadas e integrales mediante técnicas numéricas. Varias de esas técnicas se analizarán 


en esta parte del libro. 


PT6.2 ANTECEDENTES MATEMÁTICOS 


En el nivel medio superior o durante su primer año en el nivel superior, se le dio una introducción 
al cálculo diferencial e integral. Ahí usted aprendió técnicas para obtener derivadas e integrales 


exactas o analíticas. 


Cuando diferenciamos una función de manera analítica, generamos una segunda función que 
se utiliza para calcular la derivada de valores diferentes en la variable independiente. Existen reglas 
generales para este propósito. Por ejemplo, en el caso del monomio 


n 
IZA 


se aplica la siguiente regla sencilla (n + 0): 


dy _ n-1 
dx 


que es la expresión de la regla más general para 


n 


y=u 


donde u = una función de x. En esta ecuación, la derivada se calcula usando la regla de la cadena 


A 


dx dx 


Tabla PT6.1 Algunas derivadas de uso común. 
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Otras dos fórmulas se aplican a los productos o cocientes de 
funciones. Por ejemplo, si el producto de dos funciones de x(u y 
v) se representa como y = uv, entonces la derivada se calcula 
como 


Otras fórmulas útiles se resumen en la tabla PT6.1. 

Existen fórmulas similares para la integración definida, 
donde se busca determinar una integral entre límites específicos, 
como en 
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b 
yo J FO dx 
: (PT6.6) 


De acuerdo con el teorema fundamental del cálculo integral, la ecuación (PT6.6) se evalúa así 
b » 
FG) dx = Fo), 


donde F(x) = integral de f(x); es decir, cualquier función tal que F'(x) = f(x). La nomenclatura del 
lado derecho corresponde a 


E(Ol,,= F(b)- Fa) (PT6.7) 


Un ejemplo de una integral definida es 
0.8 

1= |" (0.2+25x-200x” +6751” 900: +4001*) dx (PT6.8) 
0 


En este caso, la función es un simple polinomio que puede integrarse de manera analítica al calcular 
cada término de acuerdo con la regla 


n+l b 


b 
j x" dx= 
a n+1 


donde n no puede ser igual a —1. Si se aplica esta regla a cada término de la ecuación (PT6.8) se 
obtiene 


(PT6.9) 


a 


0.8 
1=0.2x+12.5x? — Er +168.75x* -180x7 + es (PT6.10) 


0 


la cual se evalúa de acuerdo con la ecuación (PT6.7) como /= 1.6405333. Este valor es igual al área 
bajo el polinomio original [ecuación (PT6.8)] entre x = 0 y 0.8. 

La integración anterior depende del conocimiento de la regla expresada por la ecuación (PT6.9). 
Otras funciones siguen diferentes reglas. Estas “reglas” son sólo ejemplos de antidiferenciación, es 
decir, se busca encontrar F(x) de tal forma que F*(x) = f(x). En consecuencia, la integración analíti- 
ca depende del conocimiento previo de la respuesta. Tal conocimiento se adquiere con entrenamien- 
to y experiencia. Muchas de las reglas se resumen en manuales y tablas de integrales. Enlistamos 
algunas de las más comunes en la tabla PT6.2. Sin embargo, muchas funciones de importancia 
práctica son demasiado complicadas para estar contenidas en dicha tabla. Una razón por la que las 
técnicas en esta parte del libro son tan valiosas es porque ofrecen un medio para evaluar relaciones 
como la ecuación (PT6.8) sin conocimiento de las reglas. 


PT6.3 ORIENTACIÓN 


Antes de proceder con los métodos numéricos para la integración, podría ser de utilidad alguna 
orientación adicional. El siguiente material busca ofrecer una visión preliminar de los temas que se 
analizan en la parte seis. Además, formulamos algunos objetivos que ayudarán a centrar su atención 
cuando estudie la parte correspondiente. 


PT6.3.1 Alcance y presentación preliminar 


La figura PT6.10 proporciona una visión general de la parte seis. El capítulo 21 se dedica al más 
común de los procedimientos para la integración numérica (las fórmulas de Newton-Cotes). Tales 
relaciones se basan en el reemplazo de una función complicada o para datos tabulados con un simple 
polinomio que es fácil de integrar. Tres de las fórmulas de Newton-Cotes más utilizadas se examinan 
con detalles: la regla del trapecio, la regla de Simpson 1/3 y la regla de Simpson 3/8. Todas ellas se 
diseñaron para los casos donde los datos que van a integrarse están igualmente espaciados. Además, 
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Tabla PT6.2 Algunas integrales simples que se usan en la parte seis. En esta tabla las letras 
a y b son constantes y no deberán confundirse con los límites de integración 
analizados en el texto. 


Su dv = uv=Sv du 


fur du = +C n+-1 
n+1 
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Tin |x| dx =x In |x| =x+C 


ax 


Ter dx= +C 
L xer dx = z (ax— 1) + C 
a 
eS _ L ae 
a+bx vVab a 


incluimos un análisis de la integración numérica de datos irregularmente espaciados. Este tema es 
muy importante, ya que muchos de los problemas del mundo real tienen que ver con datos espaciados 
de esta manera. 

Todo el material anterior se relaciona con la integración cerrada; es decir, cuando se conocen 
los valores de la función en los límites de integración. Al final del capítulo 21 presentamos fórmulas 
de integración abierta; es decir, donde los límites de integración se extienden más allá del rango de 
los datos conocidos. Aunque estas fórmulas no se usan comúnmente para la integración definida, 
las fórmulas de integración abierta se presentan aquí debido a que se utilizan bastante en la parte 
siete para la solución de ecuaciones diferenciales ordinarias. 

Las formulaciones vistas en el capítulo 21 pueden utilizarse para analizar tanto los datos tabu- 
lados como las ecuaciones. El capítulo 22 se ocupa de tres técnicas que están expresamente diseña- 
das para integrar ecuaciones y funciones: la integración de Romberg, la cuadratura adaptativa, y 
la cuadratura de Gauss. Se proporcionan algoritmos computacionales para estos métodos. Además, 
se analizan métodos para evaluar integrales impropias. 

En el capítulo 23 se presenta información adicional sobre diferenciación numérica para com- 
plementar el material introductorio del capítulo 4. Los temas comprenden las fórmulas por diferen- 
cias finitas de alta precisión, la extrapolación de Richardson y la diferenciación de datos 
irregularmente espaciados. Se analiza el efecto de los errores tanto en la diferenciación numérica 
como en la integración. Por último, se concluye el capítulo con una descripción de la aplicación de 
diferentes paquetes de software para integración y diferenciación. 

El capítulo 24 muestra cómo se aplican los métodos a la solución de problemas. De la misma 
manera que en las otras partes del libro, los problemas se toman de los campos de la ingeniería. 

Una sección de repaso, o epílogo, se presenta al final de la parte seis. Esta revisión comprende 
un análisis de las ventajas y las desventajas que son relevantes para la implementación en la práctica 
de la ingeniería. Además, se resumen fórmulas importantes. Por último, se presenta una breve revi- 
sión de los métodos avanzados y las referencias alternativas que facilitarán sus estudios posteriores 
sobre la diferenciación y la integración numérica. 
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PT6.3.2 Metas y objetivos 


Objetivos de estudio Después de terminar la parte seis, usted será capaz de resolver muchos 
problemas de integración y diferenciación numérica y darse cuenta del valor de su aplicación en la 
solución de problemas en ingeniería. También deberá esforzarse por dominar diferentes técnicas y 
evaluar su confiabilidad. Usted deberá comprender las ventajas y las desventajas al seleccionar el 
“mejor” método (o métodos), para cualquier problema específico. Además de estos objetivos gene- 
rales, deberá asimilar y dominar los conceptos específicos que se presentan en la tabla PT6.3. 


Objetivos de cómputo  Sele han proporcionado software y algoritmos computacionales simples 
para implementar las técnicas analizadas en la parte seis. Todo esto tiene utilidad como herramien- 
ta de aprendizaje. 
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Figura PT6.10 
Esquema de la organización del material en la parte seis: Diferenciación e integración numéricas. 
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Parte 6 Diferenciación e integración numéricas 


Además, se proporcionan algoritmos para la mayoría de los otros métodos de la parte seis. Esta 
información le permitirá ampliar su software al incluir técnicas más allá de la regla del trapecio. Por 
ejemplo, quizá encuentre útil, desde un punto de vista profesional, tener software para implementar 
la integración y la diferenciación numéricas para datos irregularmente espaciados. También podrá 
desarrollar su propio software para las reglas de Simpson, la integración de Romberg, la integración 
adaptativa, y la cuadratura de Gauss, que usualmente son más eficientes y exactos que la regla del 
trapecio. 


Tabla PT6.3 Objetivos específicos de estudio de la parte seis. 


1. Entender la obtención de las fórmulas de Newton-Cotes; saber cómo obtener la regla del trapecio y cómo 
obtener las reglas de Simpson; reconocer que las reglas del trapecio y las de Simpson 1/3 y 3/8 representan 
las áreas bajo los polinomios de primero, segundo y tercer grados, respectivamente. 

2. Conocer las fórmulas y las ecuaciones de error para a) la regla del trapecio, b) la regla del trapecio de apli- 
cación múltiple, c) la regla de Simpson 1/3, d) la regla de Simpson 3/8 y e) la regla de Simpson de aplicación 
múltiple. Ser capaz de elegir la “mejor” de estas fórmulas para cualquier contexto de un problema específico. 

3. Comprender que la regla de Simpson 1/3 tiene una exactitud de cuarto orden, aun cuando se base en sólo 

tres puntos; darse cuenta de que todas las fórmulas de Newton-Cotes de segmentos pares y puntos impares 

tienen exactitud mejorada similar. 

Saber cómo evaluar la integral y la derivada de datos desigualmente espaciados. 

Reconocer la diferencia entre las fórmulas de integración abierta y cerrada. 

Comprender cómo evaluar numéricamente integrales múltiples. 

Entender la base teórica de la extrapolación de Richardson, y cómo se aplica en el algoritmo de integración 

Romberg y en diferenciación numérica. 

8. Distinguir la diferencia fundamental entre las fórmulas de Newton-Cotes y de cuadratura de Gauss. 
9. Explicar por qué la integración de Romberg y la cuadratura de Gauss tienen utilidad cuando se integran ecua- 
ciones (a diferencia de datos tabulares o discretos). 

10. Saber cómo se emplean las fórmulas de integración abierta para evaluar integrales impropias. 

11. Entender la aplicación de fórmulas de diferenciación numérica de alta precisión. 

12. Saber cómo diferenciar datos desigualmente espaciados. 

13. Reconocer los diferentes efectos del error en los datos para los procesos de integración y diferenciación nu- 

métricas. 


Nou 


Por último, una de las metas más importantes deberá ser dominar varios de los paquetes de 
software de uso general que están disponibles. En particular, usted deberá habituarse a usar estas 
herramientas para implementar los métodos numéricos en la solución de problemas de ingeniería. 


Fórmulas de integración 
de Newton-Cotes 


Las fórmulas de Newton-Cotes son los tipos de integración numérica más comunes. Se basan en la 
estrategia de reemplazar una función complicada o datos tabulados por un polinomio de aproxima- 
ción que es fácil de integrar: 


[= f f0) dx al £.(0 de (21.1) 


donde f(x) = un polinomio de la forma 


n-1 n 


F(00)=4,+a/x+: +4, Xx 


donde n es el grado del polinomio. Por ejemplo, en la figura 21.1a, se utiliza un polinomio de primer 
grado (una línea recta) como una aproximación. En la figura 21.1b, se emplea una parábola con el 
mismo propósito. 

La integral también se puede aproximar usando un conjunto de polinomios aplicados por 
pedazos a la función o datos, sobre segmentos de longitud constante. Por ejemplo, en la figura 
21.2, se usan tres segmentos de línea recta para aproximar la integral. Aunque pueden utilizarse 
polinomios de grado superior con los mismos propósitos. Con este antecedente, reconocemos que el 
“método de barras” de la figura PT6.6 emplea un conjunto de polinomios de grado cero (es decir, 
constantes) para aproximar la integral. 

Existen formas cerradas y abiertas de las fórmulas de Newton-Cotes. Las formas cerradas son 
aquellas donde se conocen los datos al inicio y al final de los límites de integración (figura 21.3a). 
Las formas abiertas tienen límites de integración que se extienden más allá del intervalo de los datos 
(figura 21.3b). En este sentido, son similares a la extrapolación que se analizó en la sección 18.5. Por 


OA FO 
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= 
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Figura 21.1 
La aproximación de una integral mediante el área bajo a) una sola línea recta y b) una parábola. 
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Figura 21.2 
09 La aproximación de una integral mediante el área bajo tres seg- 
mentos de línea recta. 


— 


Ss 
S 


lo general, las formas abiertas de Newton-Cotes no se usan para 
integración definida. Sin embargo, se utilizan para evaluar inte- 
grales impropias y para obtener la solución de ecuaciones diferen- 
ciales ordinarias. Este capítulo enfatiza las formas cerradas. No 

x obstante, al final del mismo se presenta brevemente una introduc- 
ción a las fórmulas abiertas de Newton-Cotes. 


21.1 LA REGLA DEL TRAPECIO 


La regla del trapecio es la primera de las fórmulas cerradas de integración de Newton-Cotes. Corres- 
ponde al caso donde el polinomio de la ecuación (21.1) es de primer grado: 


b b 
1=| f() dx =| £00 dx 
Recuerde del capítulo 18 que una línea recta se puede representar como [véase ecuación (18.2)] 


LO, dl (21.2) 


f(x)= fla) + 


El área bajo esta línea recta es una aproximación de la integral de f(x) entre los límites a y b: 
b 
1] LO O -0)]as 


El resultado de la integración (véase el cuadro 21.1 para detalles) es 


I=(b-a) 


> mA Q1.3) 
que se denomina regla del trapecio. 


OA FDA+ 


| 
TY 4 ZA ns Figura 21.3 


E E za e La diferencia entre las fórmulas de integración a) 
a) b) cerradas y b) abiertas. 


Cuadro 21.1 Obtención de la regla del trapecio 


Antes de la integración, la ecuación (21.2) se puede expresar como 


F(b)- fa) af(b)-afía) 
b-a b-a 


f(x)= x+ f(a) 
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I 


LO 0D, Da) 


b 


a 


b-a 2 b-a 


Este resultado se evalúa para dar: 


¡LO 10 0-4) MDL y 


Agrupando los últimos dos términos: a 2 b=a a) 
po) LOL, , parta) aftb)+afta) Atont como. 44 (0: d)(040) 
b- b- b+ 
E á 170) 01 24010) -af00) 
> Multiplicando y agrupando términos se tiene: 
_F(b)-f(a) , bfa)-af(b) +40 
O o oí 010 

la cual puede integrarse entre x= a y x= b para obtener: que es la fórmula para la regla del trapecio. 

Geométricamente, la regla del trapecio es equivalente a 

ñ Ne ñ fo 

aproximar el área del trapecio bajo la línea recta que une fía) y 
F(b) en la figura 21.4. Recuerde que la fórmula para calcular el 
área de un trapecio es la altura por el promedio de las bases (fi- 
gura 21.5a). En nuestro caso, el concepto es el mismo, pero el 
trapecio está sobre su lado (figura 21.5b). Por lo tanto, la integral tb) 
aproximada se representa como 

[ = ancho X altura promedio (Q1.4) 

f(a) 

O 

T= (b- a) Xx altura promedio Q1.5) N 
donde, para la regla del trapecio, la altura promedio es el prome- a E a 
dio de los valores de la función en los puntos extremos, o [f(a) + 

bD1/2. 

SON Figura 21.4 


Todas las fórmulas cerradas de Newton-Cotes se expresan en 
la forma general de la ecuación (21.5). De hecho, sólo difieren 
respecto a la formulación de la altura promedio. 


21.1.1 Error de la regla del trapecio 


Representación gráfica de la regla del trapecio. 


Cuando empleamos la integral bajo un segmento de línea recta para aproximar la integral bajo una 
curva, obviamente se tiene un error que puede ser importante (figura 21.6). Una estimación al error 
de truncamiento local para una sola aplicación de la regla del trapecio es (cuadro 21.2). 


+ Base Li 


— Altura — 


a) b) 


Altura 


Figura 21.5 

a) La fórmula para calcular el área de un trapecio: 
altura por el promedio de las bases. b) Para la 
regla del trapecio, el concepto es el mismo pero 
ahora el trapecio está sobre su lado. 
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Cuadro 21.2 Obtención y error estimado de la regla del trapecio 


Una manera alternativa para obtener la regla del trapecio consiste en 
integrar el polinomio de interpolación hacia adelante de Newton- 
Gregory. Recuerde que para la versión de primer grado con el térmi- 
no del error, la integral será (cuadro 18.2) 


1=[ fO0+Naarl O oo 1 dx (02121) 


Para simplificar el análisis, considere que si a = (x— a)/h, entonces 
dx=h do 


Debido a que h= b-— a (para un segmento de la regla del trapecio), 
los límites de integración a y b corresponden a0 y 1, respectivamen- 
te. Por lo tanto, la ecuación (C21.2.1) se expresará como 


1=5/ sorna LO LO do 11 ua 


Si se supone que para una h pequeña, el término f”(£) es aproximada- 
mente constante, entonces el resultado de la integración es: 


AE ” ás 3 
E, = a e a) 


Fórmulas de integración de Newton-Cotes 


Figura 21.6 

Representación gráfica del empleo de una sola aplicación 
de la regla del trapecio para aproximar la integral de f(x) = 
0.2 + 25x — 20017 + 675x* — 900x* + 400x* de x=0a0.8. 


o” oa? oa” ” 2 
121 O (E)h | 
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y evaluado como 


7 Af(a) rea 
I=h|fla)4 =222|_— h 
Ñ ) o | ml 9) 
Como Afía) = fíb) — fía), el resultado puede escribirse como 
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Regla del trapecio Error de truncamiento 


Así, el primer término es la regla del trapecio y el segundo es una 
aproximación para el error. 


(21.6) 


donde é está en algún lugar en el intervalo de a a b. La ecuación (21.6) indica que si la función su- 
jeta a integración es lineal, la regla del trapecio será exacta. De otra manera, para funciones con 
derivadas de segundo orden y de orden superior (es decir, con curvatura), puede ocurrir algún error. 


EJEMPLO 21.1 


Aplicación simple de la regla del trapecio 


Planteamiento del problema Con la ecuación (21.3) integre numéricamente 


HG) =0.2 + 25x — 200x? + 675x* — 900x* + 400x* 


21.1 Laregla del trapecio 


desde a = 0 hasta b = 0.8. Recuerde de la sección PT6.2 que el valor exacto de la integral se puede 
determinar en forma analítica y es 1.640533. 


Solución Al evaluar la función 
KO) =0.2 
K0.8) = 0.232 
sustituyendo en la ecuación (21.3) se tiene 


pe == = 0.1728 


la cual representa un error de 


E, = 1.640533 — 0.1728 = 1.467733 


que corresponde a un error relativo porcentual de e, = 89.5%. La razón de este error tan grande es evi- 
dente en la gráfica de la figura 21.6. Observe que el área bajo la línea recta no toma en cuenta una porción 
significativa de la integral que está por encima de la línea. 

En situaciones reales, tal vez no conozcamos previamente el valor verdadero. Por lo tanto, se 
requiere una estimación del error aproximado. Para obtener dicha estimación se calcula la segunda 
derivada de la función en el intervalo, derivando dos veces la función original: 


f(x) = 400 + 4 050x — 10 800x? + 8 000x* 


El valor promedio de la segunda derivada se calcula mediante la ecuación (PT6.4): 


0.8 
j (400 + 4 050x — 10 800x? +8 000x*) dx 
0 ==, 


FUÓÍ= 60 


0.8-0 


que se sustituye en la ecuación (21.6) y el resultado es 


l 3 
E, =- 1 660)(0.8)'=2.56 
a TÍ )(0.8) 


que es del mismo orden de magnitud y signo que el error verdadero. Sin embargo, de hecho, existe 
una discrepancia, ya que en un intervalo de este tamaño, el promedio de la segunda derivada no es 
necesariamente una aproximación exacta de f“(8). Así, indicamos que el error es aproximado me- 
diante la notación E,, y no exacto usando E.. 


21.1.2 La regla del trapecio de aplicación múltiple 


Una forma de mejorar la precisión de la regla del trapecio consiste en dividir el intervalo de integra- 
ción de a a b en varios segmentos, y aplicar el método a cada uno de ellos (figura 21.7). Las áreas 
de los segmentos se suman después para obtener la integral en todo el intervalo. Las ecuaciones 
resultantes se llaman fórmulas de integración, de aplicación múltiple o compuestas. 

La figura 21.8 muestra el formato general y la nomenclatura que usaremos para obtener integra- 
les de aplicación múltiple. Hay n + 1 puntos igualmente espaciados (x, X,, X,»».., X,). En consecuencia, 
existen n segmentos del mismo ancho: 


Gin 
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21.1 Laregla del trapecio 


Como la sumatoria de los coeficientes de f(x) en el numerador dividido entre 2n es igual a 1, la al- 
tura promedio representa un promedio ponderado de los valores de la función. De acuerdo con la 
ecuación (21.10), a los puntos interiores se les da el doble de peso que a los dos puntos extremos f(x) 
y fx). 

Se tiene un error con la regla del trapecio de aplicación múltiple al sumar los errores individua- 
les de cada segmento, así 


_ (b-aY y ” 
E, = = 2,1 (E,) 21.11) 


12 


donde FUE) es la segunda derivada en un punto =p localizado en el segmento ¡. Este resultado se 
simplifica al estimar la media o valor promedio de la segunda derivada en todo el intervalo como 
[ecuación (PT6.3)] 


Y ru) 


GE EEE (21.12) 
n 


Por lo tanto, 2f”(8) = nf” y la ecuación (21.11) se reescribe como 


_ (b-ay, 


E 12n? 


(21.13) 


Así, si se duplica el número de segmentos, el error de truncamiento se divide entre cuatro. Observe 
que la ecuación (21.13) es un error aproximado debido a la naturaleza aproximada de la ecuación 
Q1.12). 


EJEMPLO 21.2 Regla del trapecio de aplicación múltiple 


Planteamiento del problema Use la regla del trapecio con dos segmentos para estimar la in- 
tegral de 


JO) = 0.2 + 25x — 200x? + 675x* — 900x* + 400x* 


desde a = 0 hasta b = 0.8. Emplee la ecuación (21.13) para estimar el error. Recuerde que el valor 
correcto para la integral es 1.640533. 


Solución n=2(h=0.4): 
RO)=0.2.  fR04)=2.456  f(0.8)=0.232 


0.2 + 2(2.456) + 0.232 


1=0.8 =1.0688 
4 


E, = 1.640533 — 1.0688 = 0.57173 e,= 34.9% 


3 
E, = 068 + (60) = 0.64 
1202) 


donde —60 es el promedio de la segunda derivada, determinada anteriormente en el ejemplo 21.1. 


Los resultados del ejemplo anterior, junto con aplicaciones de la regla del trapecio con tres a diez 
segmentos, se resumen en la tabla 21.1. Observe cómo el error disminuye conforme aumenta el nú- 
mero de segmentos. Sin embargo, advierta también que la razón de disminución es gradual, a causa 
de que el error está relacionado inversamente con el cuadrado de n [ecuación (21.13)]. Por lo tanto, al 
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Tabla 21.1 Resultados de la regla del trapecio de duplicar el número de segmentos, el error se divide entre cuatro. 
aplicación múltiple para estimar la En las siguientes secciones desarrollaremos fórmulas de grado 
integral de fx) = 0.2 + 25x — 200x” + 6751 superior que son más exactas y que convergen más rápido hacia la 
- 9001" + 400x* de x=0 20.8. El valor exacto verdadera integral conforme los segmentos aumentan. Sin embar- 


adi go, antes de investigar tales fórmulas, analizaremos algoritmos 
y nm computacionales para implementar la regla del trapecio. 
n h 1 e,(%) 
o bl Mia E 21.1.3 Algoritmos computacionales para la 
3 0.2667 1.3695 16.5 la lel trapecio 
4 0.2 1.4848 9.5 IEqe Pp 
5 0.16 1.5399 6.1 En la figura 21.9 se dan dos algoritmos simples para la regla del 
6 0,1333 1.5703 43 trapecio. El primero (figura 21.9a) es para la versión de un solo 
7 0.1143 1.5887 3.2 segmento. El segundo (figura 21.9b) es para la versión de múltiples 
8 0.1 1.6008 2.4 segmentos con un ancho de segmento constante. Observe que 
9 0.0889 1.6091 1.9 ambos están diseñados para datos que se hallan en forma tabular. 
10 0.08 1.6150 1.6 Un programa general deberá tener la capacidad de evaluar tam- 
o 2 bién funciones o ecuaciones conocidas. En el siguiente capítulo 
ilustraremos cómo se manipulan las funciones. 
a) Un solo segmento b) Segmentos múltiples 
FUNCTION Trap (h, fO, f1) FUNCTION Trapmn (h, n, f) 
Trap = h * (f0 + f1)/2 sum =f, 
END Trap DOFOR¡=1,n-1 
sum =sum +2 * f, 
END DO 
sum = sum + f 
Trapm = h * sum/2 
END Trapm 
Figura 21.9 


Algoritmos para la regla del trapecio a) de un solo segmento y b) de múltiples segmentos. 


EJEMPLO 21.3 Evaluación de integrales con la computadora 

Planteamiento del problema Con software basado en la figura 21.9b resuelva un problema 
relacionado con el ya conocido: paracaidista en caída. Como usted recordará del ejemplo 1.1, la 
velocidad del paracaidista está dada con la siguiente función en términos del tiempo: 


a (E21.3.1) 
Cc 


donde y = velocidad (m/s), g = constante gravitacional de 9.8 m/s?, m = masa del paracaidista igual 
a 68.1 kg y c = coeficiente de arrastre de 12.5 kg/s. El modelo predice la velocidad del paracaidista 
como una función del tiempo, de la manera en que se describió en el ejemplo 1.1. 

Suponga que desea saber qué tan lejos ha caído el paracaidista después de cierto tiempo t£. Tal 
distancia está determinada por [ecuación (PT6.5)] 


de j v(t) dt 
0 
donde d es la distancia en metros. Sustituyendo en la ecuación (E21.3.1), 


d = | (em dt 
Cc Y0 


21.2 Reglas de Simpson 


Use su propio software, para determinar esta integral mediante la regla del trapecio de aplicación 
múltiple con diferentes números de segmentos. Observe que realizando la integración en forma 
analítica y sustituyendo los valores de los parámetros conocidos se obtiene un valor exacto de d = 
289,43515 m. 


Solución En el caso en que n = 10 se obtiene una integral calculada de 288.7491. Así, hemos 
obtenido la integral con tres cifras significativas de exactitud. Los resultados con otros números de 
segmentos son: 


Segmentos Tamaño del segmento d estimada, m £,(%) 
10 1.0 288.7491 0.237 
20 0.5 289.2636 0.0593 
50 0.2 289.4076 9.5x 10? 
100 0.1 289.4282 2.4x 10? 
200 0.05 289.4336 5.4 x 10% 
500 0.02 289.4348 1.2x 10% 
1 000 0.01 289.4360 =3.0x 10* 
2 000 0.005 289.4369 5.9 x 10% 
5 000 0.002 289.4337 5.2 x 10% 


10 000 0.001 289.4317 1.2310 


Así, hasta cerca de 500 segmentos, la regla del trapecio de aplicación múltiple obtiene excelen- 
te precisión. Sin embargo, observe cómo el error cambia de signo y empieza a aumentar en valor 
absoluto más allá de los 500 segmentos. Cuando se tienen 10 000 segmentos, de hecho, parece di- 
verger del valor verdadero. Esto se debe a la aparición del error de redondeo por el gran número de 
cálculos para todos esos segmentos. De esta manera, el nivel de precisión está limitado y nunca se 
podrá alcanzar el valor exacto de 289.4351 que se obtiene en forma analítica. Esta limitación, así 
como la manera de superarla se analizará con más detalle en el capítulo 22. 


Del ejemplo 21.3 se llega a tres conclusiones principales: 


e Para aplicaciones individuales de las funciones con buen comportamiento, la regla del trapecio 
de múltiples segmentos es casi exacta para el tipo de precisión requerida en diversas aplicaciones 
de la ingeniería. 

e Si se requiere de alta exactitud, la regla del trapecio de múltiples segmentos exige un gran tra- 
bajo computacional. Aunque este trabajo resulta insignificante para una sola aplicación, puede 
ser muy importante cuando: a) se evalúan numerosas integrales, o b) donde la función misma 
es consumidora de tiempo en su evaluación. Para tales casos, quizá se requieran métodos más 
eficientes (serán analizados en lo que falta de este capítulo y en el próximo). 

e Por último, los errores de redondeo representan una limitación en nuestra habilidad para deter- 
minar integrales. Esto se debe tanto a la precisión de la máquina como a los diversos cálculos 
involucrados en técnicas simples como la regla del trapecio de múltiples segmentos. 


Ahora analizaremos una forma para mejorar la eficiencia. Esto es, mediante polinomios de 
grado superior para aproximar la integral. 


21.2 REGLAS DE SIMPSON 


Además de aplicar la regla del trapecio con una segmentación más fina, otra forma de obtener una 
estimación más exacta de una integral consiste en usar polinomios de grado superior para unir los 
puntos. Por ejemplo, si hay otro punto a la mitad entre f(a) y f(b), los tres puntos se pueden unir con 
una parábola (figura 21.10a). Si hay dos puntos igualmente espaciados entre fía) y f(b), los cuatro 
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FO 4 


Figura 21.10 

a) Descripción gráfica de la regla de 
Simpson 1/3, que consiste en tomar 
el área bajo una parábola que une 
tres puntos. b) Descripción gráfica de 
la regla de Simpson 3/8, que consiste 
en tomar el área bajo una ecuación 
cúbica que une cuatro puntos. 


puntos se pueden unir mediante un polinomio de tercer grado (figura 21.10b). Las fórmulas que 
resultan de tomar las integrales bajo esos polinomios se conocen como reglas de Simpson. 


21.2.1 Regla de Simpson 1/3 


La regla de Simpson 1/3 resulta cuando un polinomio de interpolación de segundo grado se sustitu- 
ye en la ecuación (21.1): 


e f FO) dx = f fo) dx 


Si se designan a y b como x, y x,, y f(x) se representa por un polinomio de Lagrange de segundo 
grado [véase ecuación (18.23)], la integral se transforma en 


1=f | (x—x,Mx—x,) 63) HE 0) dx 


(Xy — Ap — 2) (x, — Xx, — x2) (, — Xy) — X, 


Después de la integración y de las manipulaciones algebraicas, se obtiene la siguiente fórmula: 
h 
IE ARA AA Q1.14) 


donde, en este caso, h =(b-— a)/2. Esta ecuación se conoce como regla de Simpson 1/3, y es la segun- 
da fórmula de integración cerrada de Newton-Cotes. La especificación “1/3” se origina del hecho de 
que h está dividida entre 3 en la ecuación (21.14). Una alternativa para obtenerla se muestra en el 
cuadro 21.3, donde se integra el polinomio de Newton-Gregory para llegar a la misma fórmula. 

La regla de Simpson 1/3 también se puede expresar usando el formato de la ecuación (21.5): 


1=0- L ED Oy+ 0) 


A A 


Ancho Altura promedio 


(21.15) 


donde a = x,, b=x, y x, = el punto a la mitad entre a y b, que está dado por (b + a)/2. Observe que, 
de acuerdo con la ecuación (21.15), el punto medio está ponderado por dos tercios; y los dos puntos 
extremos, por un sexto. 

Se puede demostrar que la aplicación a un solo segmento de la regla de Simpson 1/3 tiene un 
error de truncamiento de (cuadro 21.3) 


E 54(4) 


21.2 Reglas de Simpson 


o, como h = (b-— ay/2, 


E, E NE el —— OE) 


21.16 
2880 y 


donde ¿ está en algún lugar en el intervalo de a a b. Así, la regla de Simpson 1/3 es más exacta que 
la regla del trapecio. No obstante, una comparación con la ecuación (21.6) indica que es más exacta 
de lo esperado. En lugar de ser proporcional a la tercera derivada, el error es proporcional a la cuar- 
ta derivada. Esto es porque, como se muestra en el cuadro 21.3, el término del coeficiente de tercer 
grado se hace cero durante la integración de la interpolación polinomial. En consecuencia, la regla 
de Simpson 1/3 alcanza una precisión de tercer grado aun cuando se base en sólo tres puntos. En otras 
palabras, ¡da resultados exactos para polinomios cúbicos aun cuando se obtenga de una parábola! 
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Cuadro 21.3 Obtención y estimación del error de la regla de Simpson 1/3 


Como se hizo en el cuadro 21.2 para la regla del trapecio, la regla de 
Simpson 1/3 se obtiene al integrar el polinomio de interpolación de 
Newton-Gregory hacia adelante (cuadro 18.2): 


I= [risosaros, EA 2100) o(o—1) 
LO a Da 2) 


PLE) 4 
2 a(a-— Día -—2Xa —3)h a 


Observe que se escribió el polinomio hasta el término de cuarto 
grado, en lugar de hasta el de tercer grado como se esperaría. La 
razón de esto se verá un poco después. Advierta también que los lí- 
mites de integración van de x, a x,. Por lo tanto, cuando se realizan 
las sustituciones para simplificar (recuerde el cuadro 21.2), la integral 
esdea=0a2: 


1=5[ 0 +A (x,Jar + AO E eg 1) 
2 
AO) ana 2) 
PO) 4 
24 o(a-— Día -2(a -—3)h [uo 


que al integrarse tiene 


a a. 1 
120 fe) 7 NW (o)? a h F xp) 
a a a 
ES pnón 
e a lle dios í 
E 16 7 8 Sd | 


y evaluando en los límites se obtiene 


I=h rare LLO 4760) 


HOJA f(x, 


1 4 4 
a Sh | (C21.3.1) 


Observe el resultado significativo de que el coeficiente de la tercera 
diferencia dividida es cero. Debido a que Af(x,) =A(x,) —Ax,) y Rx.) 
= fx) - 2x,) + Ax,), la ecuación (C21.3.1) se reescribe como 


1 21/05) +4FG1) + f(x,)]- 


Regla de Simpson 1/3 


Y (Eh? 
a (5) 


Error de truncamiento 


Así, el primer término es la regla de Simpson 1/3 y el segundo es el 
error de truncamiento. Puesto que se suprime la tercera diferencia 
dividida, se obtiene el resultado significativo de que la fórmula tiene 
una precisión de tercer grado. 


EJEMPLO 21.4 Aplicación simple de la regla de Simpson 1/3 


Planteamiento del problema Con la ecuación (21.15) integre 


JO) = 0.2 + 25x — 200x? + 675x” — 900x* + 400x* 


desde a = 0 hasta b = 0.8. Recuerde que la integral exacta es 1.640533 


Solución 


KO) =0.2 F(0.4) = 2.456 F(0.8) = 0.232 


482 


09 4 


Capítulo 21 Fórmulas de integración de Newton-Cotes 


Por lo tanto, la ecuación (21.15) se utiliza para calcular 


0.2 + 4(2.456) + 0.232 
6 


1=0.8 =1.367467 


que representa un error exacto de 


E, = 1.640533 — 1.367467 = 0.2730667 e = 16.6% 


que es aproximadamente 5 veces más precisa que una sola aplicación de la regla del trapecio (ejem- 
plo 21.1). 
El error estimado es [ecuación (21.16)] 


(0.8) 


E, = (22 400) = 0.2730667 
2880 


donde -2 400 es el promedio de la cuarta derivada en el intervalo, obtenida usando la ecuación (PT6.4). 
Como en el ejemplo 21.1, el error está aproximado (E), debido a que el promedio de la cuarta deri- 
vada no es una estimación exacta de £(8). Sin embargo, como este caso tiene que ver con un poli- 
nomio de quinto grado, el resultado concuerda. 


21.2.2 La regla de Simpson 1/3 de aplicación múltiple 


Así como en la regla del trapecio, la regla de Simpson se mejora al dividir el intervalo de integración 
en varios segmentos de un mismo tamaño (figura 21.11): 


_b-a 


n 


h 


(21.17) 
La integral total se puede representar como 
le N f60) d+ f FO dr+o + f FO dx 
xo E Ea 
Al sustituir la regla de Simpson 1/3 en cada integral se obtiene 


pu SEDAAODESO) y yy [EDTASO) JO) 


Fr HALO 1 + $) 
6 


+--+2h 


o, combinando términos y usando la ecuación (21.17), 


Figura 21.11 
Representación gráfica de la regla de Simpson 1/3 de aplicación 
múltiple. Observe que el método se puede emplear sólo si el nú- 


mero de segmentos es par. 


x'Y 


21.2 Reglas de Simpson 


n=1 n-2 
FG) +4 Y, f()+2 Y, £(1,)+ Gx, 
I=(b-a) (AS j=2,4,6 (21.18) 
3n 


Ancho Peso promedio 


Observe que, como se ilustra en la figura 21.11, se debe utilizar un número par de segmentos para 
implementar el método. Además, los coeficientes “4” y “2” en la ecuación (21.18) a primera vista 
parecerían peculiares. No obstante, siguen en forma natural la regla de Simpson 1/3. Los puntos 
impares representan el término medio en cada aplicación y, por lo tanto, llevan el peso de 4 de la 
ecuación (21.15). Los puntos pares son comunes a aplicaciones adyacentes y, por lo tanto, se cuentan 
dos veces. 

Un error estimado en la regla de Simpson de aplicación múltiple se obtiene de la misma forma 
que en la regla del trapecio: sumando los errores individuales de los segmentos y sacando el prome- 
dio de la derivada para llegar a 


a) 
n= 2 e (21.19) 


donde fo es el promedio de la cuarta derivada en el intervalo. 


EJEMPLO 21.5 Versión de la regla de Simpson 1/3 de aplicación múltiple 


Planteamiento del problema Utilice la ecuación (21.18) con n = 4 para estimar la integral de 
JS) =0.2 + 25x — 200x? + 675x* — 900x* + 400x* 


desde a = 0 hasta b = 0.8. Recuerde que la integral exacta es 1.640533. 


Solución n=4(h=0.2): 


KO) =0.2 (0.2) = 1.288 
(0.4) = 2.456 F(0.6) = 3.464 
K0.8) = 0.232 


A partir de la ecuación (21.18), 


0.2 + 4(1.288 + 3.464) + 2(2.456) + 0.232 
12 
E, =1.640533-—1.623467 =0.017067 e, =1.04% 


1=0.8 =1.623467 


El error estimado [ecuación (21.19)] es 


5 
E =-L8_ 2 400) =0.017067 


. 180(4)* 


El ejemplo anterior demuestra que la versión de la regla de Simpson 1/3 de aplicación múltiple 
da resultados muy precisos. Por esta razón, se considera mejor que la regla del trapecio en la mayoría 
de las aplicaciones. Sin embargo, como se indicó antes, está limitada a los casos donde los valores 
están equidistantes. Además, está limitada a situaciones en las que hay un número par de segmentos 
y un número impar de puntos. En consecuencia, como se analizará en la siguiente sección, una 
fórmula de segmentos impares y puntos pares, conocida como regla de Simpson 3/8, se usa junto con 
la regla 1/3 para permitir la evaluación de números de segmentos tanto pares como impares. 
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21.2.3 Regla de Simpson 3/8 


De manera similar a la obtención de la regla del trapecio y Simpson 1/3, es posible ajustar un poli- 
nomio de Lagrange de tercer grado a cuatro puntos e integrarlo: 


[= f f(x) dx = NAS dx 


para obtener 
3h 
I= q UG) +37) 700) 


donde h = (b — a)/3. Esta ecuación se llama regla de Simpson 3/8 debido a que h se multiplica por 
3/8. Ésta es la tercera fórmula de integración cerrada de Newton-Cotes. La regla 3/8 se expresa 
también en la forma de la ecuación (21.5): 


2 FAJA) AI OS) +A IG) 
8 


Ancho Altura promedio 


I=(b (21.20) 


Así los dos puntos interiores tienen pesos de tres octavos, mientras que los puntos extremos tienen 
un peso de un octavo. La regla de Simpson 3/8 tiene un error de 


E 
E, =-=Pf% 
O 
o, como h= (b- a)/3, 


(b-ay (4) 
E, = = ——— 21.21 
a EEN po) (2121) 


Puesto que el denominador de la ecuación (21.21) es mayor que el de la ecuación (21.16), la regla 3/8 
es más exacta que la regla 1/3. 

Por lo cumún, se prefiere la regla de Simpson 1/3, ya que alcanza una exactitud de tercer orden 
con tres puntos en lugar de los cuatro puntos requeridos en la versión 3/8. No obstante, la regla de 
3/8 es útil cuando el número de segmentos es impar. Como ilustración, en el ejemplo 21.5 usamos 
la regla de Simpson para integrar la función con cuatro segmentos. Suponga que usted desea una 
estimación con cinco segmentos. Una opción podría ser utilizar una versión de la regla del trapecio 
de aplicación múltiple, como se hizo en los ejemplos 21.2 y 21.3. Quizá esto no sea recomendable, 
sin embargo, debido al gran error de truncamiento asociado con dicho método. Una alternativa sería 
aplicar la regla de Simpson 1/3 a los dos primeros segmentos y la regla de Simpson 3/8 a los últimos 
tres (figura 21.12). De esta forma, podríamos obtener un estimado con una exactitud de tercer orden 
durante todo el intervalo. 


EJEMPLO 21.6 Regla de Simpson 3/8 


Planteamiento del problema 


a) Con la regla de Simpson 3/8 integre 
JO) = 0.2 + 25x — 2001? + 675x* — 900x* + 400x* 


desde a = 0 hasta b =0.8. 


b) Úsela junto con la regla de Simpson 1/3 con la finalidad de integrar la misma función en cinco 
segmentos. 


21.2 Reglas de Simpson 


Solución 


fo 4 
a) Una sola aplicación de la regla de Simpson 3/8 requiere cuatro puntos 


equidistantes: 
KO) = 0.2 K0.2667) = 1.432724 ñ 
K0.5333) = 3.487177 K0.8) = 0.232 


Utilizando la ecuación (21.20), 


2 
7=0502+30.432724 apón OR 
E, =1.640533-1.519170=0.1213630  £,=7.4% 
5 
E, =- 4% 3 400)=0.1213630 , 
6 480 


b) Los datos necesarios para una aplicación con cinco segmentos (Ah = 0.16) 
son 


£(0)=02 K(0.16) = 1.296919 A O 
(032) = 1743393 100.48) = 3.186015 a Ei 
K(0.64) = 3.181929 F(0.80) = 0.232 Figura 21.12 


La integral para los dos primeros segmentos se obtiene usando la regla de Ilustración de llano elec cantata 
h las reglas de Simpson 1/3 y 3/8 para manejar 
Simpson 1/3: ER dis : , 
aplicaciones múltiples con números impares de 


0.2 +4(1.296919)+1.743393 intervalos. 


1=0.32 6 = 0.3803237 


Para los últimos tres segmentos, la regla 3/8 se utiliza para obtener 


1=0.48 A 


=1.264754 


La integral total se calcula sumando los dos resultados: 


1=0.3803237 + 1.264753 = 1.645077 


E, = 1.640533 — 1.645077 =-0.00454383 e, =-—0.28% 


21.2.4 Algoritmos computacionales para las reglas de Simpson 


En la figura 21.13 se muestran pseudocódigos para las diferentes formas de las reglas de Simpson. 
Observe que todas están diseñadas para datos en forma tabular. Un programa general deberá tener la 
capacidad de evaluar tanto las funciones como las ecuaciones conocidas. En el capítulo 22 ilustrare- 
mos cómo se manipulan las funciones. 

Advierta que el programa de la figura 21.13d está escrito para usar un número de segmentos par 
o impar. En el caso par, la regla de Simpson 1/3 se aplica a cada par de segmentos y los resultados se 
suman para calcular la integral total. En el caso impar, la regla de Simpson 3/8 se aplica a los tres 
últimos segmentos; y la regla 1/3, a los segmentos anteriores. 


21.2.5 Fórmulas cerradas de Newton-Cotes de grado superior 


Como se observó antes, la regla del trapecio y las dos reglas de Simpson son miembros de una fa- 
milia de ecuaciones de integración conocidas como fórmulas de integración cerrada de Newton- 
Cotes. Algunas de las fórmulas se resumen en la tabla 21.2, junto con el error de truncamiento. 


SSSSSS555SS 


S 


SS 


NS 
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a) d) 
FUNCTION Simpi3 (h, F0, fl, f2) FUNCTION Simpint(a,b,n,f) 
Simp13 = 2*h*(FO+A*F1I+F2) / 6 h=(b= a) 40m 
END Simp13 IF n= 1 THEN 
b) sum = Trap(h,f,,,f,) 
ELSE 


FUNCTION Simp38 (h, f0, f1, f2, f3) 


Simp38 = 3*h* (FO+3*(FI+F2I+F3) 1 8 o 


odd=n/2-= INTín / 2) 


ds IF odd > 0 AND n > 1 THEN 
c) sum = sum + Simp38(h,f_,,f, ,,f,,,F,) 
FUNCTION Simpli3m (h,n,f) m=.n-3 
sum = f(0) END IF 
DOFOR 1 = 1, n- 2,2 IF m> 1 THEN 
sum = sun+4*F,+2%*Ff,, sum = sum + Simpl3m(h,m,f) 
END DO END IF 
sum = sumM+ 4 * F ,+f, END IF 
Simpl3m = h * sum /3 Simpint = sum 
END Simp13m END SimpInt 
Figura 21.13 


Pseudocódigo para las reglas de Simpson. a) Regla de Simpson 1/3 para una sola aplicación, b) regla de Simpson 3/8 para una 
sola aplicación, c) regla de Simpson 1/3 de aplicación múltiple y d) regla de Simpson de aplicación múltiple para un número de 
segmentos tanto impares como pares. Observe que para todos los casos n debe ser = 1. 


Tabla 21.2 Fórmulas de integración cerrada de Newton-Cotes. Las fórmulas se presentan en el formato de la ecuación 
(21.5) de manera que el peso de los datos para estimar la altura promedio es aparente. 
El tamaño de paso está dado por h= (b- a)/n. 


Segmentos 


(n) Puntos Nombre Fórmula Error de truncamiento 
1 2 Regla del trapecio pa - (1/112)P"f"(5) 
2 3 Regla de Simpson 1/3 (AREA = (1/90)h? FX) 
3 4 Regla de Simpson 3/8 (b ay alto Ho AA) — (3/80)h3 FX) 
4 5 Regla de Boole (b-a) 7Í(x,)+32f(x,)4 ELA +32f(x,)+7Ax,) — (B/945)w7f91E) 
5 6 (b-a) 19(x,) + 75(x,) + 50A(x,) + 50((x,)+ 75 (x,)+19f(x,) (275/12 096)h£'%E) 
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Considere que, como en el caso de las reglas de Simpson 1/3 y 3/8, las fórmulas de cinco y seis 
puntos tienen el mismo orden de error. Esta característica general se satisface para fórmulas con 
más puntos y lleva al resultado de que las fórmulas con segmentos pares y puntos impares (por 
ejemplo, la regla 1/3 y la regla de Boole) usualmente son los métodos de preferencia. 

Sin embargo, se debe resaltar que, en la práctica de la ingeniería, las fórmulas de grado superior 
(es decir, con más de cuatro puntos) son poco utilizadas. Las reglas de Simpson bastan para la ma- 
yoría de las aplicaciones. La exactitud se puede mejorar al usar la versión de aplicación múltiple. 
Además, cuando se conoce la función y se requiere de alta precisión, otros métodos como la inte- 
gración de Romberg o la cuadratura de Gauss, descritos en el capítulo 22, ofrecen alternativas viables 
y atractivas. 


21.3 Integración con segmentos desiguales 


21.3 INTEGRACIÓN CON SEGMENTOS DESIGUALES 


Hasta aquí, todas las fórmulas de integración numérica se han basado en datos igualmente espacia- 
dos. En la práctica, existen muchas situaciones en donde esta suposición no se satisface y se tienen 
segmentos de tamaños desiguales. Por ejemplo, los datos obtenidos experimentalmente a menudo 
son de este tipo. En tales casos, un método consiste en aplicar la regla del trapecio a cada segmento 
y sumar los resultados: 


LODESO yy, LLO 4. FO, ALO) 


I=h, n 
2 


(21.22) 
donde », = el ancho del segmento ¿. Observe que éste fue el mismo procedimiento que se utilizó en 
la regla del trapecio de aplicación múltiple. La única diferencia entre las ecuaciones (21.8) y (21.22) 
es que las h en la primera son constantes. Entonces, la ecuación (21.8) podría simplificarse al agru- 
par términos para obtener la ecuación (21.9). Aunque esta simplificación no puede aplicarse a la 
ecuación (21.22), es posible desarrollar fácilmente un programa computacional para acomodar los 
segmentos de tamaño desigual. Antes de desarrollar este algoritmo, en el siguiente ejemplo ilustra- 
remos cómo se aplica la ecuación (21.22) para evaluar una integral. 


EJEMPLO 21.7 Regla del trapecio con segmentos desiguales 


Planteamiento del problema La información de la tabla 21.3 se generó usando el mismo po- 
linomio que se utilizó en el ejemplo 21.1. Con la ecuación (21.22) determine la integral para estos 
datos. Recuerde que la respuesta correcta es 1.640533. 


Solución Si se aplica la ecuación (21.22) a los datos de la tabla 21.3 se obtiene 


1=0.12 e +0.10 A +...+0,109232+2.363 


= 0.090584 + 0.130749+---+0.12975 =1.594801 


que representa un error relativo porcentual absoluto de e, = 2.8%. 


Tabla 21.3 Datos para f(x) = 0.2 + 25x — 20047 + 6717 — 900x* + 4001", 
con valores de x desigualmente espaciados. 


x 1409) x Foo) 
0.0 0.200000 0.44 2.842985 
0.12 1.309729 0.54 3.507297 
0.22 1.305241 0.64 3.181929 
0.32 1.743393 0.70 2.363000 
0.36 2.074903 0.80 0.232000 
0.40 2.456000 


Los datos del ejemplo 21.7 se ilustran en la figura 21.14. Observe que algunos segmentos adya- 
centes son de la misma anchura y, en consecuencia, podrían evaluarse mediante las reglas de Simp- 
son. Esto usualmente lleva a resultados más precisos, como lo ilustra el siguiente ejemplo. 


EJEMPLO 21.8 Empleo de las reglas de Simpson en la evaluación de datos irregulares 


Planteamiento del problema Vuelva a calcular la integral para los datos de la tabla 21.3, pero 
ahora utilice las reglas de Simpson en aquellos segmentos donde sea apropiado. 
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Regla 1/3 


Figura 21.14 

Uso de la regla del trapecio para determinar la integral de datos 
irregularmente espaciados. Observe cómo los segmentos som- 
breados podrían evaluarse con la regla de Simpson para obtener 
mayor precisión. 


Solución El primer segmento se evalúa con la regla del trapecio: 


1=0.12 E +02 — 0.09058376 


Como los siguientes dos segmentos que van de x = 0.12 a 0.32 son de igual longitud, su integral se 
calcula con la regla de Simpson 1/3: 


1.743393 + 4(1.305241)+1.309729 
6 


1=0.2 = 0.2758029 


Los siguientes tres segmentos también son iguales y, por lo tanto, pueden evaluarse con la regla 3/8 
para obtener / = 0.2726863. De manera similar, la regla 1/3 se aplica a los dos segmentos desde x = 
0.44 hasta 0.64 para dar / = 0.6684701. Finalmente, los dos últimos segmentos, que son de distinta 
longitud, se evalúan con la regla del trapecio para dar valores de 0.1663479 y 0.1297500, respecti- 
vamente. Se suma el área de esos segmentos individuales para tener como resultado una integral 
total de 1.603641. Esto representa un error de e, = 2.2%, que es mejor al resultado que se obtuvo 
mediante la regla del trapecio en el ejemplo 21.7, 


Programa computacional para datos irregularmente espaciados Programar la ecuación 
(21.22) es bastante simple. Un posible algoritmo se da en la figura 21.15a. 

No obstante, como se demostró en el ejemplo 21.8, el procedimiento mejora si se implementan 
las reglas de Simpson siempre que sea posible. Por tal razón se desarrolla un segundo algoritmo que 
incorpora esta capacidad. Como se ilustra en la figura 21.155, el algoritmo verifica la longitud de los 
segmentos adyacentes. Si dos segmentos consecutivos son de igual longitud, se aplica la regla de 
Simpson 1/3. Si tres son iguales, se utiliza la regla 3/8. Cuando los segmentos adyacentes tienen 
longitud desigual, se implementa la regla del trapecio. 

Así, no sólo permite la evaluación de datos con segmentos desiguales, sino que al usar la infor- 
mación igualmente espaciada, se reduce al empleo de las reglas de Simpson. De esta manera, repre- 
senta un algoritmo básico, para todo propósito en la determinación de la integral de datos tabulados. 


21.4 FÓRMULAS DE INTEGRACIÓN ABIERTA 


De la figura 21.3b recuerde que las fórmulas de integración abierta tienen límites que se extienden 
más allá del intervalo de los datos. La tabla 21.4 resume las fórmulas de integración abierta de 
Newton-Cotes. Las fórmulas se han expresado en la forma de la ecuación (21.5) de manera que los 
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factores de ponderación sean evidentes. Como en el caso de las versiones cerradas, pares sucesivos 
de las fórmulas tienen el mismo orden de error. Las fórmulas para segmentos pares y puntos impares 
son generalmente los métodos de preferencia, ya que requieren menos puntos para alcanzar la mis- 
ma precisión que las fórmulas de segmentos impares y puntos pares. 

Las fórmulas abiertas no se utilizan con frecuencia para la integración definida. No obstante, 
como se verá en el capítulo 22, tienen utilidad para analizar integrales impropias. Además, tendrán 
relevancia en nuestro análisis de los métodos de pasos múltiples, para la solución de ecuaciones 
diferenciales ordinarias en el capítulo 26. 


a) b) 
FUNCTION Trapun (x, y, n) FUNCTION Uneven (n,x,f) 
LOCAL 7, sum h= Xx, =X, 
sum = 0 k= 1 
DOFOR ¡1 = 1, n sum = 0. 
sum = sum + (Xx, = Xx, (Y, , + y,)/2 DOFOR j= 1, n 
END DO OF XX 
Trapun = sum IF ABS (h -= hf) < .000001 THEN 
END Trapun IF k = 3 THEN 
sum = sum + Simpl3 (h,f,,,f,,,F,,) 
k= k-= 1 
ELSE 
k=k<+1 
END IF 
ELSE 
IF k= 1 THEN 
sum = sum + Trap A 
ELSE 
IF k= 2 THEN 
sum = sum + Simpl3 (h,f,,,F,,,F,) 
ELSE 
sum= sun + Simp38 (h,f,¿,F,,.F,,.P,) 
END IF 
k= 1 
END IF 
END IF 
Figura 21.15 h= hf 
Pseudocódigo para integrar datos desigualmente END DO 
espaciados. a) Regla del trapecio y b) combinación Uneven = sum 
de las reglas de Simpson y del trapecio. END Uneven 


Tabla 21.4 Fórmulas de integración abierta de Newton-Cotes. Las fórmulas se presentan en el formato de la ecuación 
(21.5), de manera que sea aparente el peso de los datos para estimar la altura promedio. El tamaño de 
paso está dado por h = (b- aJn. 


Segmentos 
(n) Puntos Nombre Fórmula Error de truncamiento 
2 1 Método del punto medio (b-a)f(x;) (1/3)h>F"(8) 
3 3 (b- e A (3/4)H2f(E) 
4 3 eg 00 ela ano! (14/45)H5f E) 
E 4 b a 1A(x,)+ Pel foc! 1(x,) (95/144)A5F(8) 
6 a (b q) LEO) 419 0%) + 265x,)+14(x,)+11H(x5) (41/140)17f9(8) 


20 
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21.5 INTEGRALES MÚLTIPLES 


Las integrales múltiples se utilizan a menudo en la ingeniería. Por 
ejemplo, una ecuación general para calcular el promedio de una 
función bidimensional puede escribirse como sigue [recuerde la 
ecuación (PT6.4)]: 


d b 
- [[ranaja 
f= ota (21.23) 


Al numerador se le llama integral doble. 

Las técnicas estudiadas en este capítulo (y en el siguiente) se 
utilizan para evaluar integrales múltiples. Un ejemplo sencillo 
sería obtener la integral doble de una función sobre un área rec- 
tangular (figura 21.16). 

Recuerde del cálculo que dichas integrales se pueden calcular 
como integrales iteradas. 


f (£ f(x, y) ax) dy= [ (f f(x, y) 4») dx (21.24) 


Primero se evalúa la integral en una de las dimensiones y el resultado de esta primera integración 
se incorpora en la segunda dimensión. La ecuación 21.24 establece que no importa el orden de in- 
tegración. 

Una integral numérica doble estará basada en la misma idea. Primero se aplican métodos, como 
la regla de Simpson o del trapecio para segmentos múltiples, a la primera dimensión manteniendo 
constantes los valores de la segunda dimensión. Después, se aplica el método para integrar la segun- 
da dimensión. El procedimiento se ilustra en el ejemplo siguiente. 


Figura 21.16 
Integral doble sobre el área bajo la superficie de la función. 


EJEMPLO 21.9 Uso de la integral doble para determinar una temperatura promedio. 


Planteamiento del problema Suponga que la temperatura en una placa rectangular se descri- 
be mediante la siguiente función: 


T(x, y) = 2xy + 2x —x?- 2y? + 72 


0 + 2(40) + 48 


4. + 2(70) + 54 
y OEA m 4 to 496 
72 +2(64) + 24 
E o 448 
+ + 
(6-0) 256 En 448 =2 688 


Figura 21.17 
Evaluación numérica de una integral doble usando la regla del trapecio con dos segmentos. 
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Si la placa tiene 8 m de largo (dimensión x) y 6 m de ancho (dimensión y), calcule la temperatura 
promedio. 


Solución Primero, se usará la regla del trapecio con dos segmentos en cada dimensión. Las tem- 
peraturas en los valores x y y necesarios se representan en la figura 21.17. Observe que un promedio 
simple de estos valores es 47.33. La función también se evalúa analíticamente, cuyo resultado sería 
58.66667. 

Para realizar numéricamente la misma evaluación se emplea primero la regla del trapecio a lo 
largo de la dimensión x con cada uno de los valores de y. Estos valores se integran después a lo lar- 
go de la dimensión y para dar como resultado final 2 688. Dividiendo éste entre el área se obtiene la 
temperatura promedio: 2 688/(6 x 8) = 56. 

También podemos emplear la regla de Simpson 1/3 de la misma manera con un solo segmento. 
Esta integral da como resultado 2 816 y un promedio de 58.66667, que es exacto. ¿Por qué pasa esto? 
Recuerde que la regla de Simpson 1/3 dio resultados perfectos con polinomios cúbicos. Como el 
término del grado mayor en la función es de segundo grado, en el presente caso se obtiene el mismo 
resultado exacto. 


Para funciones algebraicas de grado superior, así como con funciones trascendentes, será nece- 
sario emplear segmentos múltiples para obtener estimaciones exactas de la integral. Además, el 
capítulo 22 presenta técnicas más eficientes que las fórmulas de Newton-Cotes, para la evaluación 
de integrales de funciones dadas. Éstas con frecuencia proporcionan mejores recursos para la inte- 


gración numérica de integrales múltiples. 


PROBLEMAS 


21.1 Evalúe la integral siguiente: 
xl 
[7 6+3 cos x) dx 


a) en forma analítica; b) con una sola aplicación de la regla del trapecio; 
c) con aplicación múltiple de la regla del trapecio, con n=2 y 4; d) con 
una sola aplicación de la regla de Simpson 1/3; e) con la aplicación 
múltiple de la regla de Simpson 1/3, con n=4; f) con una sola aplicación 
de la regla de Simpson 3/8, y g) con aplicación múltiple de la regla de 
Simpson, con n = 5. Para los incisos b) a g), determine el error relativo 
porcentual de cada una de las estimaciones numéricas, con base en el 
resultado del inciso a). 

21.2 Evalúe la integral siguiente: 


f A 


a) en forma analítica; b) con una sola aplicación de la regla del tra- 
pecio; c) con aplicación múltiple de la regla del trapecio, con n = 2 
y 4; d) con una sola aplicación de la regla de Simpson 1/3; e) con 
aplicación múltiple de la regla de Simpson 1/3, con n= 4; f) con una 
sola aplicación de la regla de Simpson 3/8, y g) con aplicación múl- 
tiple de la regla de Simpson, con n = 5. Para cada una de las estima- 
ciones numéricas de los incisos b) a g), determine el error relativo 
porcentual con base en el inciso a). 

21.3 Evalúe la integral siguiente: 


4 
ds (1-x-4x7+2x%) dx 


a) en forma analítica; b) con una sola aplicación de la regla del tra- 
pecio; c) con la regla del trapecio compuesta, con n= 2 y 4; d) con 
una sola aplicación de la regla de Simpson 1/3; e) con la regla de 


Simpson 3/8, y f) con la regla de Boole. Para cada una de las estima- 
ciones numéricas de los incios b) a f), determine el error relativo 
porcentual con base en el inciso a). 

21.4 Integre la función siguiente en forma analítica y con el empleo 
de la regla del trapecio, conn=1,2,3 y 4: 


de 
f (x + 21: dx 


Use la solución analítica para calcular los errores relativos porcen- 
tuales verdaderos para evaluar la exactitud de las aproximaciones de 
la regla del trapecio. 

21.5 Integre la función siguiente en forma tanto analítica como con 
la regla de Simpson, con n = 4 y 5. Analice los resultados. 


ff ax-ayar 


21.6 Integre la función siguiente tanto en forma analítica como nu- 
mérica. Emplee las reglas del trapecio y de Simpson 1/3 para integrar 
numéricamente la función. Para ambos casos, utilice la versión de 
aplicación múltiple, con n = 4. Calcule los errores relativos porcen- 
tuales para los resultados numéricos. 


54 Bok 
, Medx 


21.7 Integre la función siguiente tanto analítica como numéricamente. 
Para las evaluaciones numéricas use a) una sola aplicación de la 
regla del trapecio, b) la regla de Simpson 1/3, c) la regla de Simpson 
3/8, d) la regla de Boole, e) el método del punto medio, f) la fórmu- 
la de integración abierta de 3 segmentos y 2 puntos, y g) la fórmula 
de integración abierta de 4 segmentos y 3 puntos. Calcule los errores 
relativos porcentuales de los resultados numéricos. 
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Ñ 14% dx 


21.8 Integre la función que sigue tanto en forma analítica como nu- 
mérica. Para las evaluaciones numéricas utilice a) una sola aplicación 
de la regla del trapecio; b) la regla de Simpson 1/3; c) la regla de 
Simpson 3/8; d) aplicación múltiple de reglas de Simpson, con n = 5; 
e) la regla de Boole; f) el método del punto medio; g) la fórmula de 
integración abierta de 3 segmentos y 2 puntos, y h) la fórmula de inte- 
gración abierta de 4 segmentos y 3 puntos. 


f (5+3 cos x) dx 


Calcule los errores relativos porcentuales para los resultados numé- 
ricos. 

21.9 Suponga que la fuerza hacia arriba de la resistencia del aire 
sobre un objeto que cae es proporcional al cuadrado de la velocidad. 
Para este caso, la velocidad se calcula con 


v(t) = 00 [a 
y Ca m 


donde c, = coeficiente de arrastre de segundo orden. a) Si g = 9.81 
m/s”, m = 68.1 kg y c,= 0.25 kg/m, use integración analítica para 
determinar qué tan lejos cae el objeto en 10 segundos. b) Haga lo 
mismo, pero evalúe la integral con la regla del trapecio de segmento 
múltiple. Use una n suficientemente grande para obtener tres dígitos 
significativos de exactitud. 

21.10 Evalúe la integral de los datos tabulados a continuación, con 
a) la regla del trapecio y b) las reglas de Simpson: 


Xx | 0 0.1 0.2 0.3 0.4 0.5 
fo) | 1 8. 4 35 5 1 


21.11 Evalúe la integral de los datos que se tabula en seguida, con 
a) la regla del trapecio y b) las reglas de Simpson: 


21.12 Determine el valor medio de la función 
JO) = 46 + 45x — 141? + 2x? — 0.075x* 


entre x=2 y 10, por medio de a) graficar la función y estimar visual- 
mente el valor medio, b) con la ecuación (PT6.4) y la evaluación 
analítica de la integral, y c) con la ecuación (PT6.4) y una versión de 
cinco segmentos de la regla de Simpson para estimar la integral. 
Calcule el error porcentual relativo. 

21.13 La función f(x) = 2e7!** se puede utilizar para generar la tabla 
siguiente de datos espaciados en forma desigual: 


0.05 
1.8555 


0.15 
1.5970 


0.25 
1.3746 


035 
1.1831 


0.475 0.6 
0.9808 0.8131 


0 
fo) | 2 
Evalúe la integral de a =0 a b=0.6, con el uso de a) medios analí- 
ticos, b) la regla del trapecio, y c) una combinación de las reglas del 
trapecio y de Simpson; emplee las reglas de Simpson siempre que 
sea posible a fin de obtener la exactitud más alta. Para los incisos b) 
y c), calcule el error relativo porcentual (e). 

21.14 Evalúe la integral doble siguiente: 


Fórmulas de integración de Newton-Cotes 


1 2 
f Í (1? -2y? + xy?) dx dy 


a) en forma analítica; b) con una aplicación múltiple de la regla del 
trapecio, con n=2, y c) con aplicaciones únicas de la regla de Simp- 
son 1/3. Para los incisos b) y c), calcule el error relativo porcentual 
(e ). 

21.15 Evalúe la siguiente integral triple, a) en forma analítica y b) 
con el uso de aplicaciones únicas de la regla de Simpson 1/3. Para el 
inciso b) calcule el error relativo porcentual (e ). 


E IN $ (+ -3y2) de dy dz 


21.16 Desarrolle un programa de computadora amigable para el 
usuario para la aplicación múltiple de la regla del trapecio, con base 
en la figura 21.9. Pruebe su programa con la replicación del cálculo 
del ejemplo 21.2. 

21.17 Desarrolle un programa de cómputo amigable para el usuario 
para la versión de la aplicación múltiple de la regla de Simpson, con 
base en la figura 21.13c. Pruébelo con la duplicación de los cálculos 
del ejemplo 21.5. 

21.18 Desarrolle un programa de computadora amigable para el 
usuario a fin de integrar datos espaciados en forma desigual, con base 
en la figura 21.15b. Pruébelo con la duplicación del cálculo del 
ejemplo 21.8. 

21.19 Se recolectaron los siguientes datos para una sección trans- 
versal de un río (y = distancia de una ribera, A = profundidad y U = 
velocidad): 


y, m 0 1 3 5 7 8 9 10 
H,m 0 1 LS 3 3.5 3.2 2 0 
U, m/s 0 0.1 0.12 0.2 0.25 0.3 0.15 0 


Use integración numérica para calcular a) la profundidad promedio, 
b) el área de la sección transversal, c) la velocidad promedio y d) 
el caudal. Observe que el área de la sección transversal (A) y el 
caudal (O) se pueden calcular como 


y y 
a.= | HN dy o=/ H)UO) dy 


21.20 La concentración de salida de un reactor se mide en distintos 
momentos durante un periodo de 24 horas: 


th [o 1 55 10 12 14 16 18 20 24 
15 23 21 4 5 55 5 3 12 


c, mg/L | 1 


El caudal de salida en m'/s se puede calcular con la siguiente ecuación: 
271 
Q(t) = 20 + 10 sen ES —10) 


Use el mejor método de integración numérica para determinar el 
promedio ponderado de concentración de salida del reactor durante 
el periodo de 24 horas, 


fi QMc(ndt 
Jo Qt 


c= 


21.21 Una viga de 11 m está sujeta a una carga, y la fuerza cortante 
sigue la ecuación 


Va) =5+0.251 


donde V es la fuerza cortante y xes la distancia a lo largo de la viga. 
Se sabe que V= dM/dx y M es el momento flexionante. La integración 
conduce a la relación 


m=29,+| Vas 
0 


Si M, es cero y x= 11, calcule M con el empleo de a) integración 
analítica, b) aplicación múltiple de la regla del trapecio y c) aplicación 
múltiple de las reglas de Simpson. Para los incisos b) y c) use incre- 
mentos de 1 m. 

21.22 El trabajo producido por un proceso termodinámico a tempera- 
tura, presión y volumen constantes, se calcula por medio de 


w=| pdv 


donde W es el trabajo, p la presión y V el volumen. Con el empleo 
de una combinación de la regla del trapecio, la de Simpson 1/3, y la de 
Simpson 3/8, utilice los datos siguientes para calcular el trabajo en 
kJ (kJ =kN - m): 


Presión (kPa) | 336 294.4 266.4 260.8 260.5 2496 193.6 165.6 
0.5 2 3 4 6 8 10 11 


Volumen (m) 


21.23 Determine la distancia recorrida para los datos siguientes: 


min | 1 2 325 45 6 7 8 9 95 10 
y, mís | os 6 55 7 85 8 6 7 7 5 


a) Use la regla del trapecio, b) la mejor combinación de las reglas 
del trapecio y de Simpson, y c) la integración analítica de polinomios 
de segundo y tercer grados, determinados por regresión. 

21.24 La masa total de una barra de densidad variable está dada por 


m= la P(x)A,(x) dx 


donde m = masa, P(x) = densidad, A, (x) = área de la sección trans- 
versal, x = distancia a lo largo de la barra y L= longitud total de la 
barra. Se midieron los datos siguientes para una barra de 10 m de 
longitud. Determine la masa en kilogramos con la exactitud mejor 
posible. 
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x, m 0 2 3 4 6 8 10 
p. 9/cm? 400 3.95 389 380 360 3.41 3.30 
A. cm? 100 103 106 110 120 133 150 


21.25 Un estudio de ingeniería del transporte requiere que usted 
determine el número de autos que pasan por una intersección cuando 
viajan durante la hora pico de la mañana. Usted se para al lado de la 
carretera y cuenta el número de autos que pasan cada cuatro minutos 
a varias horas, como se muestra en la tabla a continuación. Utilice el 
mejor método numérico para determinar a) el número total de autos 
que pasan entre las 7:30 y las 9:15, y b) la tasa de autos que cruzan 
la intersección por minuto. (Sugerencia: Tenga cuidado con las uni- 
dades.) 

TA5 


Tiempo (h) | 7:30 8:00 8:15 8:45 9:15 


| 18 24 26 20 18 9 


Tasa (autos por 4 min) 


21.26 Determine el valor promedio para los datos de la figura P21.26. 
Realice la integral que se necesita para el promedio en el orden que 
muestra la ecuación siguiente: 


I= f” IN A, »ay Jas 


Figura P21.26 


Integración de ecuaciones 


En la introducción de la parte seis destacamos que las funciones que vayan a integrarse de manera 
numérica son principalmente de dos tipos: una tabla de valores o una función. La forma de los datos 
tiene una influencia importante en los procedimientos que se utilizan para evaluar la integral. Con 
información tabulada, se está limitando al número de puntos que se tengan. En cambio, si se tiene 
la función, se pueden generar tantos valores de f(x) como se requieran para alcanzar una exactitud 
aceptable (recuerde la figura PT6.7). 

Este capítulo se ocupa de tres técnicas expresamente diseñadas para analizar los casos donde 
se tiene la función. Cada una aprovecha la posibilidad de generar valores de la función para desa- 
rrollar esquemas eficientes para la integración numérica. La primera se basa en la extrapolación de 
Richardson, que es un método que combina dos estimaciones numéricas de la integral para obtener 
un tercer valor más exacto. El algoritmo computacional para implementar de manera muy eficiente 
la extrapolación de Richardson se llama integración de Romberg. Esta técnica es recursiva y se 
utiliza para generar una estimación de la integral dentro de una tolerancia de error preespecificada. 

El segundo método, la integración adaptiva, se basa en la división del intervalo de integración 
en subintervalos sucesivos más refinados de manera recursiva. Así, se utiliza espaciamiento más 
refinado donde la función varía más rápidamente, y espaciamiento más grueso donde la función 
varía lentamente, con objeto de obtener la exactitud global deseada con el menor esfuerzo de 
cálculo. 

El tercer método se denomina cuadratura de Gauss. Recuerde que en el último capítulo los 
valores de f(x) en las fórmulas de Newton-Cotes se determinaron para valores específicos de x. 
Por ejemplo, si se utiliza la regla del trapecio para determinar una integral, estamos restringidos 
a tomar el promedio ponderado de f(x) en los extremos del intervalo. Las fórmulas de cuadratura de 
Gauss emplean valores de x que están entre a y b, de forma que resulta una estimación mucho más 
exacta de la integral. 

Además de estas dos técnicas estándar, dedicamos una sección final a la evaluación de integra- 
les impropias. En este análisis nos concentraremos en integrales con límites infinitos y en mostrar 
cómo un cambio de variable y de fórmulas de integración abierta son útiles en tales casos. 


22.1 ALGORITMOS DE NEWTON-COTES PARA ECUACIONES 


En el capítulo 21 presentamos algoritmos para versiones de aplicación múltiple de la regla del tra- 
pecio y de las reglas de Simpson. Aunque estos pseudocódigos pueden usarse para analizar ecua- 
ciones, en nuestro esfuerzo por hacerlos compatibles tanto con los datos como con las funciones, no 
pueden aprovechar la ventaja de estas últimas. 

La figura 22.1 muestra los pseudocódigos que están expresamente diseñados para casos donde 
la función es analítica. En particular, observe que ni los valores de la variable independiente, ni de la 
dependiente se pasan a la función por medio de su argumento, como fue el caso para los códigos del 
capítulo 21. Para la variable independiente x, se da el intervalo de integración (a, b) y el número de 
segmentos. Esta información se emplea después para generar valores igualmente espaciados de x 
dentro de la función. Para la variable dependiente, los valores de la función en la figura 22.1 se cal- 
culan llamando a la función que está analizándose, f(x). 

Desarrollamos programas de precisión simple, basados en esos pseudocódigos, para analizar el 
trabajo implicado y los errores en que se incurre al usar progresivamente más segmentos para estimar 
la integral de una función simple. Para una función analítica, las ecuaciones del error [ecuaciones 
(21.13) y Q1.19)] indican que el aumento en el número de segmentos n resultará en estimaciones más 
exactas de la integral. Esta observación es justificada en la figura 22.2, la cual es una gráfica del error 


22.2 Integración de Romberg 


a) b) 
FUNCTION TrapEq (n, a, b) FUNCTION SimpEq (n, a, b) 
h=(b=a)/ nm h=(b=a)/ mn 
x= a x=a 
sum= f(x) sum = f(x) 
DOFOR ¡= 1, n= 1 DOFOR ¡= 1,n-2, 2 
x=x>+bh x=XxX>+bh 
sum = sum+ 2 * f(x) sum = sum+ 4 * f(x) 
END DO x=xXx>*+h 
sum = sum + f(b) sum = sum+ 2 * f(x) 
TrapEq = (b— a) * sum / (2 * n) END DO 
END TrapEq x=x>w*bh 


sum = sum+ 4 * f(x) 

sum = sum + f(b) 

Simptq = (b — a) * sum/(3 * n) 
END SimpEq 


Figura 22.1 
Algoritmos de las reglas 
a) del trapecio y b) de Simpson 1/3 de aplicaciones múltiples donde se tiene la función. 


verdadero contra n para la integral de f(x) = 0.2 + 25x — 200x? + 675x* — 900x* + 40047. Observe cómo 
el error disminuye conforme n se incrementa. Sin embargo, note también que para grandes valores de 
n, el error empieza a aumentar conforme los errores de redondeo empiezan a dominar. Observe además 
que se requiere un número muy grande de evaluaciones de la función (y, por lo tanto, de más trabajo 
de cálculo) para alcanzar altos niveles de precisión. Como una consecuencia de estas desventajas, la 
regla del trapecio y las reglas de Simpson de aplicación múltiple algunas veces resultan inadecuadas 
para resolver problemas en contextos donde se necesitan alta eficiencia y errores mínimos. 


22.2 INTEGRACIÓN DE ROMBERG 


La integración de Romberg es una técnica diseñada para obtener integrales numéricas de funciones 
de manera eficiente. Es muy parecida a las técnicas analizadas en el capítulo 21, en el sentido de que 
se basa en aplicaciones sucesivas de la regla del trapecio. Sin embargo, a través de las manipulacio- 
nes matemáticas, se alcanzan mejores resultados con menos trabajo. 


22.2.1 Extrapolación de Richardson 


Recuerde que en la sección 10.3.3 usamos refinamiento iterativo para mejorar la solución de un 
conjunto de ecuaciones lineales simultáneas. Hay técnicas de corrección del error para mejorar los 
resultados de la integración numérica con base en la misma estimación de la integral. Dichos méto- 
dos usan dos estimaciones de una integral para calcular una tercera más exacta y, en general, se les 
conoce como extrapolación de Richardson. 

La estimación y el error correspondiente a la regla del trapecio de aplicación múltiple se repre- 
senta de manera general como: 


1=1I(h) + E(h) 
donde / = el valor exacto de la integral, /(h) = la aproximación obtenida de una aplicación con n 
segmentos de la regla del trapecio, con un tamaño de paso h = (b-— a)/n, y E(h) = el error de trunca- 


miento. Si hacemos, por separado, dos estimaciones usando tamaños de paso h, y h, y tenemos va- 
lores exactos del error, 


I(h,) + E(h,) = I(h,) + E(h,) (22.1) 
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Ahora recuerde que el error de la regla del trapecio de 


aplicación múltiple puede representarse en forma aproxi- 
100 - mada mediante la ecuación (21.13) [con n = (b-— a)/h]: 
b=4,25 
E=- Hof” (22.2) 
10 12 
Si se supone que f” es constante para todo tamaño de 
e 1 paso, la ecuación 22.2 se utiliza para determinar la 
[0] 
hl : razón entre los dos errores, que será 
3 Regla del trapecio 
E E) 5 
E EN) (22.3) 
= 
SO 
[e] 
[o 
> 
O 
E 
9 
O 
LU 
Límite de precisión FIgurS: 22.2 
1075 - E Valor absoluto del error relativo porcentual verdadero 
Regla de Simpson 1/3 contra el número de segmentos para la an 
de la integral de f(x) = 0.2 + 25x — 2007 + 6751" — 900x 
10% Límite de precisión + 400x7, evaluada desde a = 0 hasta b = 0.8 mediante 
[E A E ASA PR PAI PS A [0 Xx la regla del trapecio de aplicación múltiple y la regla de 
1 4 16 64 256 1024 4096 16384 Simpson 1/3 de aplicación múltiple. Observe que ambos 
2 8 32 128 512 2048 8192 resultados indican que para un gran número de seg- 
Segmentos mentos, los errores de redondeo limitan la precisión. 


Este cálculo tiene el importante efecto de eliminar el término f” de los cálculos. Al hacerlo, fue 
posible utilizar la información contenida en la ecuación (22.2) sin un conocimiento previo de la 
segunda derivada de la función. Para lograr esto, se reordena la ecuación (22.3) para dar 


2 
h 
E(h,)= E(h, (4) 


2 


que se puede sustituir en la ecuación (22.1): 


HE 


2 
10500) 7 j] = I(h,) + E(h,) 


2 
de donde se despeja 


1(h,)=1(h,) 


Et) 1- (h,/h, Y 


Así, hemos desarrollado un estimado del error de truncamiento en términos de las estimaciones de la 
integral y de sus tamaños de paso. La estimación se sustituye después en 


I=1(h,) + E(h)) 
para obtener una mejor estimación de la integral: 


1 


I= I(h,)+ 
(2) (h,/h, y? —1 


[1(h,)- (4,11 (22.4) 


22.2 Integración de Romberg 


Se puede demostrar (Ralston y Rabinowitz, 1978) que el error de esta estimación es O(h*). Así, 
hemos combinado dos estimaciones con la regla del trapecio de O(h?) para obtener una nueva esti- 
mación de O(h*). En el caso especial donde el intervalo es dividido a la mitad (h, = hy/2), esta 
ecuación se convierte en 


I=I(h)+ 


7 U00) 10M)! 


o, agrupando términos, 


4 1 
I=1(0) 101) (22.5) 


EJEMPLO 22.1 Correcciones del error en la regla del trapecio 


Planteamiento del problema En el capítulo anterior (ejemplo 21.1 y tabla 21.1) empleamos 
varios métodos de integración numérica para evaluar la integral de f(x) = 0.2 + 25x — 200x? + 675x* 
— 900x* + 400x* desde a = 0 hasta b = 0.8. Por ejemplo, las aplicaciones simples y múltiples de la 
regla del trapecio dieron los siguientes resultados: 


Segmentos h Integral E, % 
1 0.8 0.1728 89.5 
2 0.4 1.0688 34.9 
4 0.2 1.4848 9.5 


Use esta información junto con la ecuación (22.5) para calcular mejores estimaciones de la integral. 


Solución Si se combinan las estimaciones con uno y dos segmentos resulta: 


= 2 1.0688) = =(0.1728) =1.367467 


El error de la integral mejorada es E, = 1.640533 — 1.367467 = 0.273067 (e,= 16.6%), que es mejor 
al de las estimaciones sobre las que se basó. 
De la misma manera, las estimaciones con dos y cuatro segmentos se combinan para obtener 
4 1 
= 909 e a 008) =1.623467 


que representa un error E, = 1.640533 — 1.623467 = 0.017067 (e,= 1.0%). 


La ecuación (22.4) proporciona una forma de combinar dos aplicaciones de la regla del trapecio 
con un error O(h?), para calcular una tercera estimación con un error O(h*). Este procedimiento es 
un subconjunto de un método más general para combinar integrales y obtener mejores estimaciones. 
Así, en el ejemplo 22.1, calculamos dos integrales mejoradas de O(h*) con base en tres estimaciones 
con la regla del trapecio. Estos dos cálculos mejorados pueden, a su vez, combinarse para generar 
un valor aún mejor con O(h%). En el caso especial donde las estimaciones originales con la regla del 
trapecio se basan en la división sucesiva de la mitad del tamaño de paso, la ecuación usada para una 
exactitud O(h?) es 


16 1 


Le m yg*! 
15 15 


(22.6) 


donde /,, e [, son las estimaciones mayor y menor, respectivamente. De manera similar, dos resulta- 
dos O(h%) se combinan para calcular una integral que es O(h*) utilizando 
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I==1 -—I (22.7) 


EJEMPLO 22.2 Corrección del error de orden superior en estimaciones de la integral 


Planteamiento del problema En el ejemplo 22.1 usamos la extrapolación de Richardson para 
calcular dos estimaciones de la integral de O(h*). Utilice la ecuación (22.6) para combinar esas es- 
timaciones y calcular una integral con O(h0). 


Solución Las dos estimaciones de la integral de O(h*) obtenidas en el ejemplo 22.1 fueron 1.367467 
y 1.623467. Se sustituyen tales valores en la ecuación (22.6) y se obtiene 


1 1 
T= .=.623467) e q PLA =1.640533 


que es el resultado correcto hasta siete cifras significativas que se utilizaron en este ejemplo. 


22.2.2 El algoritmo de integración de Romberg 


Observe que los coeficientes en cada una de las ecuaciones de extrapolación [ecuaciones (22.5), (22.6) 
y (22.7)] suman 1. De esta manera, representan factores de ponderación que, conforme aumenta la 
exactitud, dan un peso relativamente mayor a la mejor estimación de la integral. Estas formulaciones 
se expresan en una forma general muy adecuada para la implementación en computadora: 


A 
MEA (22.8) 
O (h?) O (h*) O (h*) O (h?) 


a) 0.172800 ——=31200407 
1.068800 

b) 0.172800 1.367467 e 
1.068800 — 1.6094 

1.484800 


c) 0.172800 .367467 1.640533 A 
1.068800 .623467 A 

1.484800 + .639467 

1.600800 

Figura 22.3 


Representación gráfica de la sucesión de estimaciones de la integral generadas usando la integración de 
Romberg. a) Primera iteración. b) Segunda iteración. c) Tercera iteración. 


donde f;, 1x1 € 1x1 = las integrales más y menos exactas, respectivamente; e [,, = la integral me- 
jorada. El subíndice k significa el nivel de la integración, donde k = 1 corresponde a la estimación 
original con la regla del trapecio, k=2 corresponde a O(K*), k= 3 a O(h%), y así sucesivamente. El 
subíndice j se usa para distinguir entre las estimaciones más (¡+ 1) y menos (7) exactas. Por ejemplo, 
con k=2 y ¡= 1, la ecuación (22.8) se convierte en 


que es equivalente a la ecuación (22.5). 


22.2 Integración de Romberg 


La forma general representada por la ecuación (22.8) se atribuye a Romberg, y su aplicación 
sistemática para evaluar integrales se denomina integración de Romberg. La figura 22.3 es una re- 
presentación gráfica de la sucesión de estimaciones de la integral generadas usando este procedi- 
miento. Cada matriz corresponde a una sola iteración. La primera columna contiene las evaluaciones 
de la regla del trapecio, designadas por /; ,, donde ¡= 1 indica una aplicación con un solo segmento 
(el tamaño de paso es b — a), ¡ =2 corresponde a una aplicación con dos segmentos [el tamaño de 
paso es (b — a)/2], ¡ =3 corresponde a una aplicación de cuatro segmentos [el tamaño de paso es 
(b — a)/4], y así sucesivamente. Las otras columnas de la matriz se generan mediante la aplicación 
sistemática de la ecuación (22.8) para obtener sucesivamente mejores estimaciones de la integral. 

Por ejemplo, la primera iteración (figura 22.3a) consiste en calcular las estimaciones con la regla 
del trapecio para uno y dos segmentos (1, , e £, ¡). La ecuación (22.8) se utiliza después para calcular 
el elemento /, ,= 1.367467, el cual tiene un error de O(h?). 

Ahora, debemos verificar y establecer si este resultado es adecuado a nuestras necesidades. 
Como en los otros métodos aproximados de este libro, se requiere un criterio de paro, o de termina- 
ción, para evaluar la exactitud de los resultados. Un método que es útil para el propósito actual es 
[ecuación (3.5)] 


Lua 


100% (22.9) 


Lk 


donde e, = una estimación del error relativo porcentual. De esta manera, como sucedió en los ante- 
riores procesos iterativos, se compara la nueva estimación con un valor anterior. Cuando la diferen- 
cia entre los valores anteriores y nuevos representada por e, está por debajo de un criterio de error 
preespecificado e,, termina el cálculo. En la figura 22.3a, esta evaluación indica 21.8% de cambio 
con respecto a la primera iteración. 

El objetivo de la segunda iteración (figura 22.3b) es obtener la estimación O(h%), 1, ,. Para ha- 
cerlo, se determina una estimación más con la regla del trapecio, /,, = 1.4848. Después, ésta se 
combina con /, , usando la ecuación (22.8) para generar 1, , = 1.623467, El resultado se combina, a 
su vez, con /, , para obtener /, ¿ = 1.640533. Se aplica la ecuación (22.9) para determinar que este 
resultado representa un cambio del 1.0% cuando se compara con el resultado previo, Í, ,. 

La tercera iteración (figura 22.3c) continúa con el proceso de 
la misma forma. En tal caso, la estimación del trapecio se suma a 
la primera columna y, después, se aplica la ecuación (22.8) para 
calcular en forma sucesiva integrales más exactas a lo largo de la 


diagonal inferior. Después de sólo tres iteraciones, debido a que se A 


FUNCTION Romberg (a, b, maxit, 
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es) 


evalúa un polinomio de quinto grado, el resultado (1, , = 1.640533) a q E TrapEgín, a, b) 
es exacto. ¡ É ep = 0 
La integración de Romberg es más eficiente que las reglas DO 
del trapecio y de Simpson analizadas en el capítulo 21. Por ejem- iter = iter+ 1 
plo, para la determinación de una integral como la de la figura n = 2tter 


22.1, la regla de Simpson 1/3 requeriría una aplicación con 256 
segmentos para dar un estimado de 1.640533. Aproximaciones 
más finas no serán posibles debido al error de redondeo. En cam- 
bio, la integración de Romberg ofrece un resultado exacto (a 
siete cifras significativas) basada en la combinación de aplicacio- 
nes de la regla del trapecio con uno, dos, cuatro y ocho segmentos; 
es decir, ¡con sólo 15 evaluaciones de la función! 

La figura 22.4 representa el pseudocódigo para la integración 
de Romberg. Mediante el uso de ciclos, este algoritmo implementa 
el método en una forma eficiente. La integración de Romberg está 
diseñada para casos en donde se conoce la función que se va a in- 
tegrar. Esto se debe a que el conocimiento de la función permite las 
evaluaciones requeridas para la implementación inicial de la regla 
del trapecio. Los datos tabulados rara vez están en la forma reque- 
rida para dividirlos a la mitad sucesivamente como se requiere. 


Iiters1,1 = TrapEqín, a, b) 
DOFOR k = 2, ¡ter + 1 
J=23w+ ¡ter - k 
Lar ATA Tia 7 Ly AA 1) 
ea = ABSU(Lz iterer 7 T2iterd/ Li sters1) * 100 

IF (¡ter 2 maxit OR ea < es) EXIT 
END DO 
Romberg = li ster+1 


END Romberg 


Figura 22.4 

Pseudocódigo para la integración de Romberg, que usa la 
versión de segmentos del mismo tamaño de la regla del 
trapecio, a partir de la figura 22.1. 
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22.3 CUADRATURA ADAPTIVA 


Aunque la integración de Romberg es más eficiente que la regla compuesta de Simpson 1/3, ambas 
usan puntos igualmente espaciados. La perspectiva global ignora el hecho de que muchas funciones 
tienen regiones de alta variabilidad junto con otras secciones en las que el cambio es gradual. 

Los métodos de cuadratura adaptiva resuelven esta situación ajustando el tamaño de paso de 
modo que se usan pequeños intervalos en regiones de variación rápida, e intervalos mayores cuya 
función cambia gradualmente. La mayoría de estas técnicas se basa en la aplicación de la regla de 
Simpson 1/3 a subintervalos de un modo muy similar a la utilización de la regla de compuesto tra- 
pezoidal en la extrapolación de Richardson. Es decir, la regla de 1/3 se aplica en dos niveles de re- 
finamiento, y la diferencia entre estos dos niveles se usa para estimar el error de truncamiento. Si el 
error de truncamiento es aceptable, no se necesita más refinamiento, y el estimado de la integral para 
el subintervalo se considera aceptable. Si el estimado de error es demasiado grande, entonces se 
refina el tamaño de paso y se repite el proceso hasta que el error caiga a niveles aceptables. Luego 
se calcula la integral total como la suma de los estimados de integrales para los subintervalos. 

La base teórica de este enfoque se puede ilustrar para un intervalo x= a a x= b con una ampli- 
tud de h, = b— a. Se puede hacer un primer estimado de la integral con la regla de Simpson 1/3, 


h 
L(hy) = 7 a) +4f(c) + (0) (22.10) 


donde c = (a + b)/2. 

Como en la extrapolación de Richardson, se puede obtener un estimado más refinado disminu- 
yendo a la mitad el tamaño de paso. Es decir, aplicando la regla de Simpson 1/3 de aplicación múl- 
tiple con n = 4. 


h 
I(h2) = a) +4f(d)+2f(c)+4f(e)+ F(b)) Q2.11) 


donde d = (a+ c)/2, e =(c+b)N y h,=h,/2. 
Como /1(h,) e I(h,) son estimados de la misma integral, su diferencia da una medida del error. 
Es decir, 


ES I(h2)- 1h) (22.12) 


Además, el estimado y el error correspondiente a cualquiera de las dos aplicaciones se puede repre- 
sentar generalmente como 


I=I(M+E(h) (22.13) 


donde / = valor exacto de la integral, /(h) = aproximación de una aplicación de n segmentos de la 
regla de Simpson 1/3 con tamaño de paso h = (b-— a)/n y E(h) = el error correspondiente de trunca- 
miento. 

Usando un enfoque similar a la extrapolación de Richardson, se puede obtener un estimado del 
error del estimado más refinado, /(h,), como función de la diferencia entre los dos estimados de 
integral. 


E(h>) = UU) =1(h1)] (22.14) 
El error se puede entonces agregar a /(h,) para generar un estimado todavía mejor 

1=1(42) + ¿11 02)— 100)! (22.15) 
Este resultado es equivalente a la regla de Boole. 

Las ecuaciones anteriores desarrolladas se pueden ahora combinar en un algoritmo eficien- 


te. La figura 22.5 presenta un pseudocódigo para un algoritmo, así que está basado en un archivo 
M de MATLAB desarrollado por Cleve Moler (2005). 


22.3 Cuadratura adaptiva 


FUNCTION quadapt(a, b) (función principal de llamada) 
tol = 0.000001 

c= (a+ b)/2 (inicialización) 
fa = f(a) 

fc = fíc) 

fb= F(b) 

quadapt = qstep(a, b, tol, fa, fc, fb) 

END quadapt 


FUNCTION gstepía, b, tol, fa, fc, fb) (función recursiva) 

hl=b=a 

h2 = h1/2 

c= (a + b)2 

fd = fí(a + C)/2) 

fe = f((c + b)/2) 

I1= h1/6 * (fa + 4 * fc + fb) (Regla de Simpson 1/3) 

12 = h2/6 * (fa+ 4* fd+ 2* fc0+4* fe + fb) 

IF |12= 11| < tol THEN (terminar después de la regla de Boole) 
I=12+ (12 - 11)/15 

ELSE (llamadas recursivas si se necesitan) 
la = qstepía, C, tol, fa, fd, fc) 
Ib = qstepíc, b, tol, fc, fe, fb) Figura 22.5 


Il 
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l= la + Ib Pseudocódigo para algoritmo de cuadratura 


END IF adaptiva, basado en un archivo M de 
gstep = I MATLAB desarrollado por Moler (2005). 


END qstep 


La función consiste en una función principal de llamada, quadapt, junto con una función re- 
cursiva, qstep, que realmente ejecuta la integración. Como se muestra en la figura 22.5, tanto 
quadapt como qstep deben tener acceso a otra función, £, que evalúa el integrando. 

La función principal de llamada, quadapt, acepta como argumentos de entrada a los límites 
de integración a y b. Después de establecer la tolerancia, se calculan las evaluaciones de la función 
que se necesita para la aplicación inicial de la regla de Simpson 1/3 [ecuación (22.10)]. Estos valores, 
junto con los límites de integración, se pasan luego a qstep. Dentro de qstep se determinan los 
restantes tamaños de paso y valores de función, y se calculan los dos estimados de integral [ecua- 
ciones (22.10) y (22.11)]. 

En este punto, se estima el error como la diferencia absoluta entre los estimados de integral. 
Dependiendo del valor del error, pueden suceder dos cosas: 


1. Si el error es menor o igual que la tolerancia, se genera la regla de Boole, la función termina y 
se entrega el resultado. 

2. Si el error es mayor que la tolerancia, se llama dos veces qgstep para evaluar cada uno de los 
dos subintervalos de la llamada actual. 


Las dos llamadas recursivas en el segundo paso representan la belleza real de este algoritmo. 
Estas llamadas siguen subdividiendo hasta que se cumple con la tolerancia. Una vez que esto sucede, 
sus resultados se pasan de regreso por la ruta recursiva, combinándose en el camino con los otros 
estimados de integral. El proceso termina cuando se satisface la llamada final, se evalúa la integral 
total y se devuelve a la función principal de llamada. 

Se debe destacar que el algoritmo de la figura 22.5 es una versión simplificada de la función 
quad, que es la función profesional para ubicar raíces utilizada en MATLAB. Por lo tanto, no 
protege contra fallas como casos en los que las integrales no existen. Sin embargo, funciona bien 
para muchas aplicaciones, y ciertamente para ilustrar cómo opera la cuadratura adaptiva. 
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f(x) 


f(x) 


el área bajo la línea recta que pasa por dos puntos interme- 
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22.4 CUADRATURA DE GAUSS 


En el capítulo 21 estudiamos fórmulas de integración numérica o cuadratura conocidas como ecua- 
ciones de Newton-Cotes. Una característica de estas fórmulas (con excepción del caso especial de 
la sección 21.3) fue que la estimación de la integral se basó en valores igualmente espaciados de la 
función. En consecuencia, la localización de los puntos que se usaron en estas ecuaciones eran pre- 
determinados o fijos. 

Por ejemplo, como se describe en la figura 22.6a, la regla del trapecio se basa en obtener el área 
bajo la línea recta que une los valores de la función, en los extremos del intervalo de integración. La 
fórmula que se utiliza para calcular esta área es 


JJOO 


I=(b (22.16) 
donde a y b son los límites de integración y b — a = el ancho del intervalo de integración. Debido a 
que la regla del trapecio necesita los puntos extremos, existen casos como el de la figura 22.64, 
donde la fórmula puede dar un gran error. 

Ahora, suponga que se elimina la restricción de los puntos fijos y se tuviera la libertad de evaluar 
el área bajo una línea recta que uniera dos puntos cualesquiera de la curva. Al ubicar esos puntos en 
forma inteligente, definiríamos una línea recta que equilibrara los errores negativo y positivo. Así 
que, como en la figura 22.6b, llegaríamos a una mejor estimación de la integral. 

Cuadratura de Gauss es el nombre de una clase de técnicas para realizar tal estrategia. Las 
fórmulas particulares de cuadratura de Gauss descritas en esta sección se denominan fórmulas de 

Gauss-Legendre. Antes de describir el procedimiento, mostrare- 
mos que las fórmulas de integración numérica, como la regla del 
trapecio, pueden obtenerse usando el método de coeficientes in- 
determinados. Este método se empleará después para desarrollar 
las fórmulas de Gauss-Legendre. 


22.4.1 Método de coeficientes indeterminados 


En el capítulo 21 obtuvimos la regla del trapecio integrando un 
polinomio de interpolación lineal y mediante un razonamiento 


geométrico. El método de coeficientes indeterminados ofrece un 
x tercer procedimiento que también tiene utilidad para encontrar 
otras técnicas de integración, como la cuadratura de Gauss. 

Para ilustrar el procedimiento, la ecuación (22.16) se expresa 
como 


SS SS I=c,Ka) +c Ab) (22.17) 
donde las c = constantes. Ahora observe que la regla del trapecio 


deberá dar resultados exactos cuando la función que se va a inte- 
grar es una constante o una línea recta. Dos ecuaciones simples 
que representan esos casos son y = 1 y y = x. Ambas se ilustran 
E en la figura 22.7. Así, las siguientes igualdades se deberán satis- 


facer: 


(b-a)/2 
Cy +C¡= j l dx 


<4b-a)/2 
Figura 22.6 

a) Representación gráfica de la regla del trapecio como el y 

área bajo la línea recta que une los puntos extremos fijos. bid ba peon 

b) Se obtiene una mejor estimación de la integral tomando Co 2 +C, 2 = f, a dx 


dios. Estos puntos se ubican en una forma adecuada, de tal o, evaluando las integrales, 
manera que se equilibran los errores positivo y negativo. 


Cy+c =b-a 


2 2 


Estas son dos ecuaciones con dos incógnitas que se resuelven para 
encontrar 


que, al sustituirse en la ecuación (22.17), da 
b-a 
2 


que es equivalente a la regla del trapecio. 


fe rorZ10) 


22.4.2 Desarrollo de la fórmula de Gauss- 
Legendre de dos puntos 


Así como en el caso anterior para la obtención de la regla del 
trapecio, el objetivo de la cuadratura de Gauss es determinar los 
coeficientes de una ecuación de la forma 


ERA) (22.18) 


donde las c = los coeficientes desconocidos. Sin embargo, a dife- 
rencia de la regla del trapecio que utiliza puntos extremos fijos a 
y b, los argumentos de la función x, y x, no están fijos en los ex- 
tremos, sino que son incógnitas (figura 22.8). De esta manera, 
ahora se tienen cuatro incógnitas que deben evaluarse y, en con- 
secuencia, se requieren cuatro condiciones para determinarlas con 
exactitud. 

Así, como con la regla del trapecio, es posible obtener dos de 
esas condiciones al suponer que la ecuación (22.18) ajusta con 
exactitud la integral de una constante y de una función lineal. 
Después, para tener las otras dos condiciones, sólo se ampliará 
este razonamiento al suponer que también ajusta la integral de 
una función parabólica (y = 1?) y de una cúbica (y = x7). Al ha- 
cerlo, se determinan las cuatro incógnitas y además se obtiene 
una fórmula de integración lineal de dos puntos que es exacta para 
cúbicas. Las cuatro ecuaciones que habrá que resolver son: 


ef) +ef(0)=/, 1dr=2 (22.19) 
Cf) + fo) = E xdx=0 (22.20) 
eta) f)=|,  de= z (22.21) 
cof) +0 f(x) = E Y dx=0 22.22) 


Las ecuaciones (22.19) a (22.22) pueden resolverse simultánea- 
mente para encontrar 


c=c,=1 


1 
X. === -0.5773503... 


43 
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—(b- a) b-a x 


a) 


b) 


Figura 22.7 
Dos integrales que deberán evaluarse exactamente por la 
regla del trapecio: a) una constante y b) una línea recta. 


Figura 22.8 
Representación gráfica de las variables desconocidas x, y x; 
para la integración por medio de la cuadratura de Gauss. 
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1 
== =0.5773503... 
Xx; WE 


que se sustituye en la ecuación (22.18) para obtener la fórmula de Gauss-Legendre de dos puntos 


5) $) (22.23) 


Así, llegamos al interesante resultado de que la simple suma de los valores de la función en 
x=1/43 y -1/43 genera una estimación de la integral que tiene una exactitud de tercer grado. 

Observe que los límites de integración en las ecuaciones (22.19) a (22.22) son desde —1 a 1. Esto 
se hizo para simplificar la matemática y para hacer la formulación tan general como sea posible. Es 
posible utilizar un simple cambio de variable para transformar otros límites de integración a esta 
forma. Esto se realiza suponiendo que una nueva variable x, está relacionada con la variable original 
x en una forma lineal, como sigue 


X= Up + 01X4 (2.24) 
Si el límite inferior, x= a, corresponde a x,=-—l, estos valores se sustituyen en la ecuación (22.24): 

a=ay+ al) (22.25) 
De manera similar, el límite superior, x = b, corresponde a x, = 1, para tener 

b=a,+a(1) (22.26) 


Las ecuaciones (22.25) y (22.26) podrán resolverse simultáneamente para obtener 


a,= D+a (22.27) 
2 
y 
a,= Ad (22.28) 
2 
que se sustituye en la ecuación (22.24) con el siguiente resultado: 
pS (b+a)+(b=a)x, (22.29) 
2 
Esta ecuación se diferencia para dar 
dx= a "dx, (22.30) 


Las ecuaciones (22.29) y (22.30) pueden sustituirse ahora por x y dx, respectivamente, en la ecuación 
que se habrá de integrar. Tales sustituciones efectivamente transforman el intervalo de integración 
sin cambiar el valor de la integral. El siguiente ejemplo ilustra cómo se hace esto en la práctica. 


EJEMPLO 22.3 Fórmula de Gauss-Legendre de dos puntos 


Planteamiento del problema Con la ecuación (22.23) evalúe la integral de 
fc) =0.2 + 25x — 200x? + 6751? — 900x* + 400x* 
entre los límites x= 0 y x= 0.8. Recuerde que éste fue el problema que resolvimos en el capítulo 21, 


con las fórmulas de Newton-Cotes. El valor exacto de la integral es 1.640533. 


Solución Antes de integrar la función, debemos realizar un cambio de variable para que los lími- 
tes sean de —1 a +1. Para ello, sustituimos a = 0 y b= 0.8 en la ecuación (22.29) para obtener 
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x=0.4+0.4x, 
La derivada de esta relación es [ecuación (22.30)] 
dx =0.4dx, 


Ambas ecuaciones se sustituyen en la ecuación original para dar 
0.8 
j (0.2+25x —200x” +675x? — 900x* + 4001”) dx 
0 


1 
= j [0.2 +25(0.4+0.4x,)—200(0.4+0.4x,,) +675(0.4+0.4x,)* 
=] 
—900(0.4+0.4.x,)* + 400(0.4+0.4.x,,)"]0.4dx,, 


Así, el lado derecho está en la forma adecuada para la evaluación mediante la cuadratura de Gauss. 
La función transformada se evalúa en —1/-/3 que es igual a 0.516741 y en 1/-/3 que es igual a 
1.305837. Por lo tanto, la integral, de acuerdo con la ecuación (22.23), es 


IT =0.516741 + 1.305837 = 1.822578 


que representa un error relativo porcentual de —-11.1%. El resultado es comparable en magnitud a la 
aplicación de la regla del trapecio de cuatro segmentos (tabla 21.1) o a una aplicación simple de las 
reglas de Simpson 1/3 y 3/8 (ejemplos 21.4 y 21.6). Se espera este último resultado ya que las reglas 
de Simpson son también de tercer grado de exactitud. Observe que, debido a la elección inteligente de 
los puntos, la cuadratura de Gauss alcanza esta exactitud considerando tan sólo dos evaluaciones 
de la función. 


22.4.3 Fórmulas con más puntos 


Aparte de la fórmula de dos puntos descrita en la sección anterior, se pueden desarrollar versiones 
con más puntos en la forma general 


1= Cf) + Of) + +0 1H, 1) (22.31) 


donde n = número de puntos. Los valores de las c y las x para fórmulas de hasta seis puntos se resu- 
men en la tabla 22.1. 


EJEMPLO 22.4 Fórmula de Gauss-Legendre de tres puntos 


Planteamiento del problema Use la fórmula de tres puntos con la tabla 22.1 para estimar la 
integral de la misma función que en el ejemplo 22.3. 
Solución De acuerdo con la tabla 22.1, la fórmula de tres puntos es 
T=0.5555556/(-0.7745967) + 0.8888889£.0) + 0.5555556/(0.7745967) 
que es igual a 


T=0.2813013 + 0.8732444 + 0.4859876 = 1.640533 


que es exacta. 


Como la cuadratura de Gauss requiere evaluaciones de la función en puntos irregularmente 
espaciados dentro del intervalo de integración, no es apropiada para los casos donde la función no 
se conoce. Es decir, para problemas que tratan con datos tabulados, será necesario interpolar para 
el argumento dado. Sin embargo, cuando se conoce la función, su eficiencia es de una ventaja deci- 
siva, en particular cuando se deben realizar muchas evaluaciones de la integral. 
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Tabla 22.1 Factores de ponderación c y argumentos de la función x usados en las fórmulas de 
Gauss-Legendre. 


Factor de Argumentos Error de 


Puntos ponderación de la función truncamiento 

2 Co = 1.0000000 Xo =-0.577350269 =FWE) 
c, = 1.0000000 x= 0.577350269 

3 Co = 0.5555556 Xo =-0.774596669 = FE) 
Cc, = 0.8888889 x= 0.0 
€, = 0.5555556 x= 0.774596669 

4 Co = 0.3478548 Xo =-0.861136312 = FE) 
€, = 0.6521452 Xx; =-0.339981044 
C, = 0.6521452 x= 0.339981044 
Cz = 0.3478548 x= 0.861136312 

5 Co = 0.2369269 Xo =-0.906179846 = WE) 
Cc, = 0.4786287 Xx, =-0.538469310 
C, = 0.5688889 x= 0.0 
Cz = 0.4786287 X= 0.538469310 
€, = 0.2369269 Xa= 0.906179846 

6 Co =0.1713245 Xo =-0.932469514 = ME) 
Cc, = 0.3607616 Xx, =-0.661209386 
€, = 0.4679139 x, =-0.238619186 
C3 = 0.4679139 x= 0.238619186 
€, = 0.3607616 Xa= 0.661209386 


Cc¿=0.1713245 X= 0.932469514 


EJEMPLO 22.5 Aplicación de la cuadratura de Gauss al problema del paracaidista 
en caída 


Planteamiento del problema En el ejemplo 21.3 se usó la regla del trapecio de aplicación 
múltiple para evaluar 


10 
d= o [1-07 q 


Cc 0 


donde g = 9.8, c = 12.5 y m= 68.1. El valor exacto de la integral se determinó por medio del cálcu- 
lo, igual a 289.4351. Recuerde que la mejor estimación obtenida usando la regla del trapecio con 
500 segmentos fue 289.4348 con un le, =1.115x 10%. Repita este cálculo usando la cuadratura 
de Gauss. 


Solución Después de modificar la función, se obtienen los siguientes resultados: 


Estimación con dos puntos = 290.0145 
Estimación con tres puntos = 289.4393 
Estimación con cuatro puntos = 289,4332 
Estimación con cinco puntos = 289.4351 
Estimación con seis puntos = 289.4351 


Así, las estimaciones con cinco y seis puntos dan resultados que son exactos hasta la séptima cifra 
significativa. 


22.5 Integrales impropias 


22.4.4 Análisis del error en la cuadratura de Gauss 


El error en las fórmulas de Gauss-Legendre por lo general se especifica mediante (Carnahan y co- 
laboradores, 1969) 


Ñ 2 +D 11 
'" Cn+31CN+2)! 


ñ is 6 (22.32) 


donde n = el número de puntos menos uno y £9"+*2(E) = la (2n + 2)-ésima derivada de la función, 
después del cambio de variable con $ localizada en algún lugar en el intervalo desde —1 hasta 1. Una 
comparación de la ecuación (22.32) con la tabla 21.2 indica la superioridad de la cuadratura de Gauss 
respecto a las fórmulas de Newton-Cotes, siempre que las derivadas de orden superior no aumenten 
sustancialmente cuando se incremente n. El problema 22.8 al final de este capítulo ilustra un caso 
donde las fórmulas de Gauss-Legendre tienen un desempeño pobre. En tales situaciones, se prefieren 
la regla de Simpson de aplicación múltiple o la integración de Romberg. No obstante, en muchas de 
las funciones encontradas en la práctica de la ingeniería, la cuadratura de Gauss proporciona un 
medio eficiente para la evaluación de las integrales. 


22.5 INTEGRALES IMPROPIAS 


Hasta aquí, hemos analizado exclusivamente integrales que tienen límites finitos e integrandos 
acotados. Aunque esos tipos son de uso común en ingeniería, habrá ocasiones en que se deban eva- 
luar integrales impropias. En esta sección nos ocuparemos de un tipo de integral impropia. Es decir, 
una con límite inferior —co y/o límite superior +0o. 

Tales integrales a menudo se resuelven con un cambio de variable, que transforma el límite 
infinito en uno finito. La siguiente identidad sirve para este propósito y trabaja con cualquier función 
decreciente hacia cero, por lo menos tan rápido como 1/x?, conforme x se aproxima a infinito: 


b l/a 1 1 
f FG) dx = IM pl (>) dt (22.33) 


para ab > 0. Por lo tanto, se utiliza sólo cuando a es positiva y b es co, o cuando a es —oo y b es ne- 
gativa. En los casos donde los límites son desde —co a un valor positivo o desde un valor negativo a 
co, la integral puede calcularse en dos partes. Por ejemplo, 


b —A b 
FO) dx = j f0) dx +] f60) dx (22.34) 
qe e A 


donde —A se elige como un valor negativo lo suficientemente grande para que la función comience 
a aproximarse a cero, en forma asintótica por lo menos tan rápido como 1/x?. Después que la integral 
se divide en dos partes, la primera podrá evaluarse con la ecuación (22.33) y la segunda con una 
fórmula cerrada de Newton-Cotes como la regla de Simpson 1/3. 

Un problema al usar la ecuación (22.33) para evaluar una integral es que la función transforma- 
da será singular en uno de los límites. Pueden usarse las fórmulas de integración abierta para evitar 
este dilema, ya que permiten la estimación de la integral sin emplear los puntos extremos del inter- 
valo de integración. Para tener máxima flexibilidad, se requiere una de las fórmulas abiertas vistas 
en la tabla 21.4 de aplicación múltiple. 

Las fórmulas abiertas de aplicación múltiple podrán combinarse con las fórmulas cerradas para 
los segmentos interiores y fórmulas abiertas para los extremos. Por ejemplo, si se combinan la regla 
del trapecio de segmentos múltiples y la regla del punto medio se obtiene 
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Figura 22.9 
Colocación de datos para los límites de 
Y %an Xsn E integración en la regla extendida del punto 
Le JL PA a | 1] medio. 
xo Te, 
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so n2 
IST AN) 


Además, es posible desarrollar fórmulas semiabiertas para casos donde uno u otro extremo del 
intervalo es cerrado. Por ejemplo, una fórmula que es abierta en el límite inferior y cerrada en el 
superior está dada como sigue: 


Xn nl 
f! f(x) dx = ¡TO 


Aunque se pueden usar estas relaciones, una fórmula preferida es (Press y colaboradores, 1992) 


IM CN (22.35) 


que se conoce como la regla extendida del punto medio. Observe que esta fórmula se basa en límites 
de integración que están /h/2 después y antes del primer y del último dato respectivamente (figura 
22.9). 


EJEMPLO 22.6 Evaluación de una 
integral impropia 


Planteamiento del problema La distribución 
normal acumulativa es una fórmula importante en 
estadística (figura 22.10): 


NG) = 11 AP (E22.6.1) 
¡Zn 


donde x= (y — y )/s, se llama la desviación estándar 
normalizada, la cual representa un cambio de varia- 
ble para escalar la distribución normal, de tal forma 
que esté centrada en cero y la distancia a lo largo de 
la abscisa se mida en múltiplos de la desviación es- 
tándar (figura 22.10b). 

La ecuación (E22.6.1) representa la probabilidad 
de que un evento sea menor que x. Por ejemplo, si x 
= 1, la ecuación (E22.6.1) se utiliza para determinar 


=$] 0 1 2 3 x la probabilidad de que ocurra un evento que es menor 
que una desviación estándar por arriba de la media, 
es decir N(1) = 0.8413. En otras palabras, si ocurren 
100 eventos, aproximadamente 84 serán menores 
que la media más una desviación estándar. Como la 
ecuación (E22.6.1) no puede evaluarse de una ma- 


Figura 22.10 

a) La distribución normal, b) la abscisa transformada 
en términos de la desviación normal estandarizada y 
Cc) la distribución normal acumulada. El área som- 
breada en a) y el punto en c) representan la proba- 
bilidad de que un evento aleatorio sea menor que la 


media más una desviación estándar. 


xY 


22.5 Integrales impropias 


nera funcional simple, se resuelve numéricamente y se presenta en tablas estadísticas. Con la ecuación 
(22.34), la regla de Simpson 1/3 y la regla extendida del punto medio determine N(1) en forma nu- 
mérica. 


Solución La ecuación (E22.6.1) se expresa en términos de la ecuación (22.34) como sigue: 


Ear 1 
N(x)= rl e“ Pdx+ [a] 


La primera integral se evalúa empleando la ecuación (22.33): 


2 2 Ol 1/08) 
e dx= e dt 
=00 12 É 


Después la regla extendida del punto medio con h = 1/8 se empleará para estimar 


A | 2 1 
es e di = ¿ÍCanó)+ FO sn) + FG gn6) + FO 116)) 
1 
8 


[0.3833 + 0.0612 +0+0]= 0.0556 


Para estimar la segunda integral se usa la regla de Simpson 1/3 con h = 0.5, como sigue 


ll e“Pdx 
2 
=11-(2 0.1353 +4(0.3247 + 0.8825 + 0.8825) + 2(0.6065 + 1) + 0.6065 
3(6) 
= 2.0523 


Entonces, el resultado final se calcula mediante 


N()= EEN (0.0556 + 2.0523) = 0.8409 
/2 TT 


que representa un error e, = 0.046 por ciento. 


El cálculo anterior mejora de diferentes maneras. Primero, se podrían utilizar fórmulas de gra- 
do superior; por ejemplo, mediante una integración de Romberg. Segundo, pueden usarse más pun- 
tos. Press y colaboradores (2007) exploran con detalle ambas opciones. 

Además de los límites infinitos, hay otras formas en las cuales una integral llega a ser impropia. 
Ejemplos comunes incluyen casos donde la integral es singular tanto en los límites como en un 
punto dentro de la integral. Press y colaboradores (2007) ofrecen un excelente análisis sobre las 
formas de manejar esas situaciones. 
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PROBLEMAS 


22.1 Utilice la integración de Romberg de orden »* para evaluar 
3 
j xe dx 
0 


Compare €, y €,. 
22.2 Use la integración de Romberg para evaluar 


2 
I= f E + z) dx 
l Xx 
con una exactitud de e, = 0.5% basada en la ecuación (22.9). Debe 
presentar sus resultados en la forma de la figura 22.3. Utilice la solu- 
ción analítica de la integral para determinar el error relativo porcentual 
del resultado obtenido con la integración de Romberg. Verifique que 


e, es menor que el criterio de detención e,. 
22.3 Emplee la integración de Romberg para evaluar 


I e'sen x 


7 dx 
0 1+x 


con una exactitud de e, = 0.5%. Debe presentar sus resultados en la 
forma de la figura 22,3. 

22.4 Obtenga una estimación de la integral del problema 22.2, pero 
use fórmulas de Gauss-Legendre con dos, tres y cuatro puntos. Cal- 
cule e, para cada caso sobre la base de la solución analítica. 

22.5 Obtenga una estimación de la integral del problema 22.1, pero 
use las fórmulas de Gauss-Legendre con dos, tres y cuatro puntos. 
Calcule e, para cada caso sobre la base de la solución analítica. 
22.6 Obtenga una estimación de la integral del problema 22.3 con 
el uso de la fórmula de Gauss-Legendre con cinco puntos. 

22.7 Realice el cálculo de los ejemplos 21.3 y 22.5 para el paracai- 
dista que cae, pero use la integración de Romberg (€, = 0.05%). 
22.8 Emplee fórmulas de Gauss-Legendre de dos a seis puntos para 
resolver 


3-1 
J 7 dx 
31+x 


Interprete sus resultados a la luz de la ecuación (22.32). 

22.9 Use integración numérica para evaluar lo siguiente: 
> dx 

dls» 


b) Jl e” sen? y dy 


c) 2) dy d) A ye? dy 


1 
o (1+y2(1+y 


o 1 
e) IN rá 
Observe que la integral del inciso e) es la distribución normal (re- 
cuerde la figura 22.10). 
22.10 Con base en la figura 22.1, desarrolle un programa de cómpu- 
to amigable para el usuario, para segmentos múltiples de las reglas 
a) del trapecio y b) de Simpson 1/3. Pruébelo con la integración de 


en 
* dx 


[12-04 de 


Utilice el valor verdadero de 0.602298 para calcular e, para n = 4. 
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22.11 Desarrolle un programa de computadora amigable para el 
usuario para la integración de Romberg, con base en la figura 22.4. 
Pruébelo con la replicación de los resultados de los ejemplos 22.3 y 
22,4, y la función del problema 22.10. 

22.12 Desarrolle un programa de computadora amigable para el 
usuario para cuadratura adaptiva, basado en la figura 22.5. Pruébelo 
resolviendo el problema 22.10. 

22.13 Desarrolle un programa de computadora amigable para el 
usuario para la cuadratura de Gauss. Pruébelo con la duplicación de 
los resultados de los ejemplos 22.3 y 22.4, y la función del problema 
22.10. 

22.14 No existe forma cerrada para la solución de la función de error, 


erf(a) = dx 


2 a 
ari! o * 
Emplee el enfoque de la cuadratura de Gauss de dos puntos para 
estimar erf(1.5). Observe que el valor exacto es 0.966105. 

22.15 La cantidad de masa transportada por un tubo durante cierto 
periodo se calcula con 


M= ll O(nc(r)d 


donde M = masa (mg), f, = tiempo inicial (min), £, = tiempo final 
(min), O(?) = tasa de flujo (m'/min) y c(t) = concentración (mg/m/). 
Las representaciones funcionales siguientes definen las variaciones 
temporales en el flujo y la concentración: 


O(1)=9+5c0s*(0.41) 
c(t) = 560% + egos 


Determine la masa transportada entre f, = 2 min y f, = 8 min, con 
integración de Romberg para una tolerancia de 0.1%. 

22.16 Las profundidades de un río H se miden a distancias espacia- 
das iguales a través de un canal como se muestra en la tabla siguien- 
te. El área de la sección transversal del río se determina por 
integración con 


A = A H(x)dx 


Emplee integración de Romberg para llevar a cabo la integración con 
un criterio de detención de 1%. 


x, m | 2 4 6 8 10 12 14 16 


Hm | 18 2-2 24 Ze 225 112. 0 
22.17 Recuerde que la velocidad de un paracaidista en caída libre 


con arrastre lineal se puede calcular analíticamente como 
om 
vt) = a -ecm, 
Cc 


donde v(+) = velocidad (m/s), f= tiempo (s), g= 9.81 m/s?, m = masa 
(kg), c = coeficiente de arrastre lineal (kg/s). Use la integración de 
Romberg para calcular la distancia que viaja el paracaidista durante 
los primeros 8 segundos de caída libre dados m= 80 kg y c= 10 kg/s. 
Calcule la respuesta hasta e, = 1%. 

22.18 Pruebe que la ecuación (22.15) es equivalente a la regla de 
Boole. 


Diferenciación numérica 


a AS N di 


VE 


En el capítulo 4 ya se introdujo la noción de diferenciación numérica. Recuerde que se emplearon las 
expansiones en serie de Taylor para obtener las aproximaciones de las derivadas en diferencias finitas 
divididas. En el mismo capítulo se desarrollaron las aproximaciones en diferencias divididas hacia 
adelante, hacia atrás y centradas para la primer derivada y las derivadas de orden superior. Recuerde 
que, en el mejor de los casos, dichas estimaciones tenían errores que fueron O(h?); es decir, sus erro- 
res eran proporcionales al cuadrado del tamaño de paso. Este nivel de exactitud se debe al número de 
términos de la serie de Taylor que se utilizaron durante la deducción de esas fórmulas. Ahora se 
mostrará cómo desarrollar fórmulas de mayor exactitud utilizando más términos. 


23.1 FÓRMULAS DE DIFERENCIACIÓN CON ALTA EXACTITUD 


Como se indicó antes, se pueden generar fórmulas por diferencias divididas de alta exactitud toman- 
do términos adicionales en la expansión de la serie de Taylor. Por ejemplo, la expansión de la serie de 
Taylor hacia adelante se escribe como [ecuación (4.21)]: 


Ax, ) = MA) + FP G)h + E +. (23.1) 
de la que se despeja 
Fx) o mm F(x,) En h+0(13) (23.2) 


En el capítulo 4 truncamos este resultado al excluir los términos de la segunda derivada en 
adelante y nos quedamos con un resultado final, 
A, 
fe. AO a 1 00m) (23.3) 
Ahora retendremos, en cambio, el término de la segunda derivada sustituyendo la siguiente 
aproximación de la segunda derivada [recuerde la ecuación (4.24)] 


FX) 2.8%, 41) + F(X,) 


Fx) = mE + O(h) (23.4) 


en la ecuación (23.2) para dar 


IA ANIRASO, FO) 24,41) + F(%,) 


F'(x,) . E h+0(h?) 
o, al agrupar términos, 
FO) E =P +44 (41) 344) +01) (23.5) 


2h 


Observe que al incluir el término de la segunda derivada mejora la exactitud a O(h?). Es posible 
desarrollar versiones similares mejoradas para las fórmulas hacia atrás y centradas, así como para 
las aproximaciones de derivadas de orden superior. Las fórmulas se resumen en las figuras 23.1 a 
23.3, junto con todos los resultados del capítulo 4. El siguiente ejemplo ilustra la utilidad de esas 
fórmulas para la estimación de las derivadas. 
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EJEMPLO 23.1 Fórmulas de diferenciación con alta exactitud 


Planteamiento del problema Recuerde que en el ejemplo 4.4 estimamos la derivada de 
Ka) =-0.1x* — 0,15x* — 0.51? — 0.25x + 1.2 


en x = 0.5 usando diferencias divididas finitas y un tamaño de paso: h = 0.25, 


Hacia adelante Hacia atrás Centrada 

O(h) O(h) O(h?) 

Estimación -1.155 0.714 0.934 

e, (%) -26.5 21.7 -2.4 
Primera derivada Error 
fx.) Fx 
Pa) 010) 
Fx, +4 Hx .)-3ñ(x, 

F(x)= ( la2) a ( ) O(h?) 


Segunda derivada 


Fx, )-2HMx,,) + (x,) 


i+ ) 
pu). A 01h) 
f Ax, 5f + 2f 
f(x, El 0 +3) Ln Qi, 1) (x,) O(h?) 
Tercera derivada 
Pr RA 3H Xx, ,,) -Hx;) O(h) 
Fx) 3HX;, ¿) +14 H(X,, 3) ei +18Fx,,,)-5H(x,) O(h?) 
2h 
Cuarta derivada 
f(x) A O(h) 
f(x) = 2 (Xx, ¿) 4 11HX,, 4) seal 26Hx,,)-14P(x,,,)+3Hx;) Ol) 
h 
Figura 23.1 


Fórmulas de diferencias finitas divididas hacia adelante: se presentan dos versiones para cada derivada. 
La última versión emplea más términos de la expansión de la serie de Taylor y, en consecuencia, es más 
exacta. 


donde los errores fueron calculados basándose en el valor verdadero: -0.9125. Repita este cálculo, 
pero ahora emplee las fórmulas con alta exactitud a partir de las figuras 23.1 a 23.3. 


Solución Los datos necesarios para este ejemplo son 
x ,=0 fKx,_)=1.2 
x,_,=0.25 fix, ,) =1.1035156 
x,=0.5 Fx) =0.925 


Primera derivada 


Segunda derivada 


f(x) -2f(x,_)+Fx,_,) 
h? 
2f(x,)-5Hx,_,)+4ñ(x,_,)=HX,_3) 
h? 


ms 


f(x) 
Tercera derivada 


f(x )-3(x,_)+3f(x,_,) Fx, _,) 
hp? 


Fx) 


Fx) ES 


23.1 Fórmulas de diferenciación con alta exactitud 


5A(x,)-18Hx,_,)+24F(x,_,)-14ñ(x,_3)+3Mx,_,) 


2h? 


Cuarta derivada 


Fx) -4f(x,_)+6f(x,_,)-4f(x,_,J+F(%,_,) 


pre z ) ¡ 


he? 


f(x) ax 


3MNx,)-14H(x,_,) + 26Hx,_,)-24Hx, 3) +11H(x,_,)-2MH(x,_,) 


h* 


Figura 23.2 


Fórmulas de diferencias finitas divididas hacia atrás: se presentan dos versiones para cada derivada. La 
última versión emplea más términos de la expansión de la serie de Taylor y, en consecuencia, es más 


exacta. 


Primera derivada Error 
Fx) fx.) 
F Ns 1+1 i-1 2 
(x,) EE AR O(h?) 
Fx, +8 Hx, 1) -8Hx, + HX,_,) 
(x,) 12h O(h*) 
Segunda derivada 
Ax, -2Hx + HX,_,) 
f(x) e 1 ra 1 o(h?) 
yo xi, 2) H16Hx,, )-30x,) +16(x,_,) Fx; _,) 
(x,) 12h? O(h*) 
Tercera derivada 
lá =2Hx, )+2ñHNx. _)-f 
Fx.) (X.,2) e) : (x,_,) (x,_,) O(h?) 
j 2h 
Fx +8 (x, 13Hx, )+13Hx, 8BHx_ + Hx 
f(x) ( lua) ( 142) ( 121) - ( len ( 142) ( 169) O(h*) 
8h 
Cuarta derivada 
qe FO A 4 HG) ,_ 1H, 2) 
P(x)= q O(h?) 
mn —HX,, ¿)412H(x,, ,) +39 x,, ,) +56ñH(x,)-39H(x,_,)+12Mx,_,) + x,_3) 
f (0) 6h* O(h*) 
Figura 23.3 


Fórmulas de diferencias finitas divididas centradas: se presentan dos versiones para cada derivada. La últi- 
ma versión emplea más términos de la expansión de la serie de Taylor y, en consecuencia, es más exacta. 
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x,,,=0.75 Fx, ,) =0.6363281 
Xi, = 1 Kx,, ,) = 0.2 
La diferencia hacia adelante de exactitud O(h?) se calcula como sigue (figura 23.1): 


-0.2+4(0.6363281)—3(0.925) 
2(0.25) 


F"(0.5)= 0.859375  €,=5.82% 


La diferencia hacia atrás de exactitud O(h?) se calcula como (figura 23.2): 


3(0.925) - 4(1.1035156)+ 1.2 


OS 2(0.25) 


=-0.878125 e, =3.11% 


La diferencia centrada de exactitud O(h*) se calcula como (figura 23.3): 


-0.2+8(0.6363281)—8(1.1035156) + 1.2 — 
12(0.25) 


F(0.5)= 0.9125 £,=0% 


Como se esperaba, los errores para las diferencias hacia adelante y hacia atrás son considera- 
blemente menores y los resultados más exactos que los del ejemplo 4.4. Sin embargo, de manera 
sorprendente, la diferencia centrada da un resultado perfecto. Esto es porque las fórmulas se basan 
en la serie de Taylor, y son equivalentes a polinomios que pasan a través de los puntos asociados con 
los datos. 


23.2 EXTRAPOLACIÓN DE RICHARDSON 


Hasta aquí hemos visto que hay dos formas para mejorar la estimación obtenida al emplear diferen- 
cias finitas divididas: 1) disminuir el tamaño de paso o 2) usar una fórmula de grado superior que 
emplee más puntos. Un tercer procedimiento, basado en la extrapolación de Richardson, utiliza dos 
estimaciones de la derivada para calcular una tercera aproximación más exacta. 

Recuerde de la sección 22.2.1 que la extrapolación de Richardson constituye un medio para 
obtener una mejor estimación de la integral / por medio de la fórmula [ecuación (22.4)] 


I=I(h)+ 


1 
1)! 036) 
LY 


donde /(h,) e I(h,) son estimaciones de la integral obtenidas usando dos tamaños de paso, h, y h,. 
Debido a su conveniencia cuando se expresa como un algoritmo computacional, esta fórmula usual- 
mente se escribe para el caso en que h, = h /2, como 


4 1 

I= 34) - 5 (23.7) 

De manera similar, la ecuación (23.7) se escribirá para las derivadas como 
_4 1 

D= 38 - O (23.8) 
Para aproximaciones por diferencia centrada con O(43), la aplicación de esta fórmula dará una nue- 
va estimación de la derivada de O(h?). 
EJEMPLO 23.2 Extrapolación de Richardson 
Planteamiento del problema Utilizando la misma función que en el ejemplo 23.1, estime la 
primera derivada en x= 0.5 empleando tamaños de paso h, =0.5 y h, = 0.25. Después, con la ecua- 


ción (23.8) calcule una mejor estimación con la extrapolación de Richardson. Recuerde que el valor 
verdadero es -0.9125. 
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Solución Las estimaciones de la primera derivada se calculan con diferencias centradas como 
sigue: 
D(0.5) = 


mo =-1.0 € =-9.6% 


pops LS BIAAAS =-0.934375 €, =-2.4% 


0.5 


Se determina una mejor estimación aplicando la ecuación (23.8) al obtener 


D= 20934375) - A) =-0.9125 


que, en este caso, es un resultado perfecto. 


El ejemplo anterior dio un resultado perfecto debido a que la función analizada era un polinomio 
de cuarto grado. El resultado perfecto se debió al hecho de que la extrapolación de Richardson, en 
realidad, es equivalente a ajustar un polinomio de grado superior a los datos y después evaluar las 
derivadas con diferencias divididas centradas. Así, este caso concuerda, precisamente, con la deri- 
vada del polinomio de cuarto grado. Para las otras funciones que no son polinomios, por supuesto, 
esto no ocurrirá y nuestra estimación de la derivada será mejor, pero no perfecta. En consecuencia, 
como en el caso de la aplicación de la extrapolación de Richardson, el procedimiento puede aplicar- 
se de manera iterativa usando un algoritmo de Romberg, hasta que el resultado se halle por debajo 
de un criterio de error aceptable. 


23.3 DERIVADAS DE DATOS IRREGULARMENTE ESPACIADOS 


Los procedimientos analizados hasta ahora se diseñaron principalmente para determinar la deriva- 
da de una función dada. Para las aproximaciones por diferencias finitas divididas de la sección 23.1, 
los datos deben estar igualmente espaciados. Para la técnica de extrapolación de Richardson de la 
sección 23.2, los datos deben estar igualmente espaciados y generados por sucesivas divisiones 
a la mitad de los intervalos. Para tener un buen control del espaciamiento de datos, con frecuencia, 
sólo es posible cuando se utiliza una función para generar la tabla de valores. 

Sin embargo, la información empírica (es decir, datos a partir de experimentos o de estudios de 
campo) con frecuencia se obtiene a intervalos desiguales. Tal información no puede analizarse con 
las técnicas estudiadas hasta aquí. 

Una manera de emplear datos irregularmente espaciados consiste en ajustar un polinomio de 
interpolación de Lagrange de segundo grado [recuerde la ecuación (18.23)] a cada conjunto de tres 
puntos adyacentes. Recuerde que estos polinomios no requieren que los puntos estén igualmente 
espaciados. Si se deriva analíticamente el polinomio de segundo grado se obtiene 


fas) HE A 
x= f(x X; 
e (1 AM, 1 — X 41) (%, —X,_ MX, —X, 41) 
e 
A (23.9) 


(Aj 0%, 41 — X,) 


donde x es el valor en el cual se quiere estimar la derivada. Aunque esta ecuación es más complica- 
da que las aproximaciones de la primera derivada de las figuras 23.1 a 23.3, tiene importantes ven- 
tajas. Primero, sirve para estimar la derivada en cualquier punto dentro de un intervalo determinado 
por los tres puntos. Segundo, los puntos no tienen que estar igualmente espaciados y tercero, la es- 
timación de la derivada tiene la misma exactitud que la diferencia centrada [ecuación (4.22)]. De 
hecho, con puntos igualmente espaciados, la ecuación (23.9) evaluada en x = x, se reduce a la ecua- 
ción (4.22). 
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EJEMPLO 23.3 Diferenciación de datos 


Aire 10 12 135 T(*C) ; E 
¡ 7 > irregularmente espaciados 
Suelo 
1.25 + 0 Planteamiento del problema Como se muestra en la figura 
23.4, un gradiente de temperatura puede medirse abajo del suelo. 
El flujo de calor en la interfaz suelo-aire puede calcularse me- 
diante la ley de Fourier, 
3.15 - 0) q(z=0)= oa 
dz 2=0 
z cm donde q = flujo de calor (W/m?), k = coeficiente de difusividad 
Y térmica en el suelo (= 3.5 x 107 m?/s), p = densidad del suelo (= 
1800 kg/m*) y C = calor específico del suelo (= 840 J/(kg - *C)). 
Figura 23.4 Observe que un valor positivo del flujo indica que el calor se trans- 
Temperatura contra la profundidad bajo fiere del aire al suelo. Utilice diferenciación numérica para evaluar 
el suelo. el gradiente en la interfaz suelo-aire y emplee dicha estimación para 


determinar el flujo de calor bajo el suelo. 


Solución La ecuación (23.9) se utiliza para calcular la deriva- 
da como sigue 


2(0)-1.25-3.75 +10 2(0)-0-3.75 
(0-1.25)(0 — 3.75) (1.25 014.25 -— 3.75) 
2(0) -0-1.25 
(3.75 013.75 -1.25) 
= -14.4+14.4-1.333333 = -1.333333%C/cm 


F'()=13.5 


que al ser sustituida se obtiene (advierta que 1 W = 1 J/s), 


m? E) J ( =) 
=0)=- 7 1800 840 133.3333 — 
az =0)=-3.5x 10 a ( PE ke 0 e 


= 70.56 W/m? 


23.4 DERIVADAS E INTEGRALES PARA DATOS CON ERRORES 


Además de tener espaciados irregulares, otro problema en la diferenciación de datos empíricos es 
que generalmente se presentan errores de medición. Una desventaja de la diferenciación numérica 
es que tiende a amplificar los errores de los datos. La figura 23.5a muestra datos uniformes sin erro- 
res, que al diferenciarse numéricamente producen un resultado adecuado (figura 23.5c). En cambio, 
la figura 23.5b usa los mismos datos, pero con algunos puntos ligeramente por arriba y otros por 
abajo. Esta pequeña modificación es apenas notoria en la figura 23.5b. Sin embargo, el efecto resul- 
tante en la figura 23.5d es significativo, ya que el proceso de diferenciación amplifica los errores. 
Como era de esperarse, el principal procedimiento para determinar derivadas de datos impreci- 
sos consiste en usar regresión por mínimos cuadrados, para ajustar una función suave y diferenciable 
a los datos. Si no se tiene alguna otra información, una regresión polinomial de grado inferior podría 
ser una buena elección. Obviamente, si se conoce la verdadera relación funcional entre las variables 
dependiente e independiente, esta relación deberá ser la base para el ajuste por mínimos cuadrados. 


23.4.1 Diferenciación versus integración de datos inciertos 


Así como las técnicas para el ajuste de curvas, como la regresión, se utilizan para diferenciar datos 
inciertos, se emplea un proceso similar para la integración. No obstante, debido a la diferencia en 
estabilidad entre diferenciación e integración, esto rara vez se hace. 
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Figura 23.5 A 
Ilustración de cómo los pequeños 
errores en los datos se amplifican 
mediante la diferenciación numé- 
rica: a) datos sin error, b) datos 
modificados ligeramente, c) resul- 
tado de la diferenciación numérica e 5 
que se obtiene de la curva a), y d) a di 
la diferenciación resultante de la 
curva b) que manifiesta un aumen- 
to en la variabilidad. En cambio, la 
operación inversa de integración 
[moviéndose de d) a b) y tomando 
el área bajo d)] tienden a suavizar o 5 4 
atenuar los errores en los datos. o) d) 


= Y 


Diferenciando 
Diferenciando 


Como se ilustra en la figura 23.5, la diferenciación tiende a ser inestable; es decir, amplifica los 
errores. En cambio, el hecho de que la integración sea un proceso de suma tiende a hacerlo muy 
estable respecto a datos inciertos. En esencia, conforme los puntos se suman para formar una integral, 
los errores aleatorios positivos y negativos tienden a compensarse. En cambio, debido a que la dife- 
renciación es sustractiva, los errores aleatorios positivos y negativos tienden a sumarse. 


23.5 DERIVADAS PARCIALES 


Las derivadas parciales a lo largo de una sola dimensión se calculan del mismo modo que las deri- 
vadas ordinarias. Por ejemplo, suponga que se quiere determinar las derivadas parciales para una 
función bidimensional, f(x, y). Para datos igualmente espaciados, las primeras derivadas parciales 
se pueden aproximar con diferencias centradas, 


df  — FAH+Ax, y)— f(x Ax, y) (23.10) 
Ox = 2Ax 


df _ f(x, y + Ay)— f(x, y — Ay) 
dy 2Ay 


(23.11) 


Todas las demás fórmulas y todos los demás enfoques que se han expuesto hasta ahora se pueden 
aplicar para evaluar derivadas parciales de un modo similar. 

Para derivadas de mayor orden, se podría desear diferenciar una función con respecto a dos o 
más variables diferentes. El resultado se llama derivada parcial mixta. Por ejemplo, se puede querer 
tomar la derivada parcial de f(x, y) con respecto a ambas variables independientes 


ef _ 0 L) (23.12) 
dxdy  0xN0y 


Para desarrollar una aproximación con diferencia finita, se puede primero formar una diferencia en 
x de las derivadas parciales en y, 


0 0 
ef yO Ar y) 3 685,9) 


dxdy 2Ax dela) 
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Luego se pueden usar las diferencias finitas para evaluar cada una de las parciales en y, 


FA+Ax, y HAY) FU+ Ax y Ay) f(0— Ax, y + Ay)— f(x— Ax, y — Ay) 


af 2Ay 2Ay 
= a 23.14 
0x0dy 2Ax ano 
Agrupando términos se obtiene el resultado final 
FFAA y Ay) f0+Ax, y — Ay) f(— Ax, y + Ay) + f(x Ax, y — Ay) sais; 


0x0y 4AxAy 


23.6 INTEGRACIÓN/DIFERENCIACIÓN NUMÉRICAS 
CON PAQUETES DE SOFTWARE 


Los paquetes de software tienen muchas capacidades para la integración y la diferenciación numé- 
rica. En esta sección le daremos una muestra de algunas de las más útiles. 


23.6.1 MATLAB 


MATLAB tiene una variedad de funciones incorporadas que permiten integrar y diferenciar fun- 
ciones y datos (tabla 23.1). En esta sección se ilustrarán algunas de estas capacidades. 


Tabla 23.1 Funciones MATLAB para implementar a) integración y b) diferenciación. 


Función Descripción 

a) Integración: 

cumtrapz Integración trapezoidal numérica acumulativa 

dblquad Evaluar numéricamente integral doble 

polyint Integrar polinomio analíticamente 

quad Evaluar numéricamente integral, cuadratura adaptiva Simpson 
quadgk Evaluar numéricamente integral, cuadratura adaptiva Gauss-Kronrod 
quadl Evaluación numérica integral, cuadratura adaptiva Lobatto 
quadv Cuadratura vectorizada 

trapz Integración trapezoidal numérica 

triplequad Evaluar numéricamente integral triple 


b) Diferenciación: 


del2 Laplaciana discreta 

diff Diferencias y derivadas aproximadas 
gradient Gradiente numérico 

polyder Derivada de polinomio 


MATLAB puede integrar tanto datos discretos como funciones. Por ejemplo, trapz calcula la 
integral de valores discretos usando la regla trapezoidal de aplicaciones múltiples. La siguiente es 
una sencilla representación de su sintaxis: 


q = trapz(x, y) 


donde los dos vectores, x y y, contienen las variables independiente y dependiente, respectivamente, 
y g contiene la integral resultante. También tiene otra función, cumtrapz que calcula la integral 
acumulativa. Para este caso, el resultado es un vector cuyos elementos g(x) contienen la integral de 
x (l)ax (k). 

Cuando el integrando está disponible en forma funcional, quad genera la integral definida 
usando cuadratura adaptiva. La siguiente es una representación sencilla de su sintaxis: 


gq = quad (fun, a, b) 


donde fun es la función que se va a integrar y a y bson los límites de integración. 
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EJEMPLO 23.4 Uso de la integración numérica para calcular distancia a partir 
de velocidad 


Planteamiento del problema Como se describió en la sección PT6.1, se puede usar integración 
para calcular la distancia, y(1), de un objeto con base en su velocidad, v(t), como en 


y(t) = / v(t) dt (E23.4.1) 
0 


Recuerde de la sección 1.1 que la velocidad de un paracaidista en caída libre, sujeto a arrastre lineal 
y con velocidad inicial cero, se puede calcular con 


v(t) = = (1 = e) (E23.4.2) 


Si se sustituye la ecuación (E23.4.2) en la ecuación (E23.4.1), el resultado se puede integrar analíti- 
camente, con la condición inicial, y (0) = 0, para dar 


2 
4 E ( a e) 
C C 


Este resultado se puede usar para calcular que un paracaidista de 70 kg con un coeficiente de arras- 
tre de 12.5 kg/s caerá 799/73 m durante un periodo de 20 s. 

Use funciones MATLAB para realizar numéricamente la misma integración. Además, desarro- 
lle una gráfica de las distancias analíticas y calculadas numéricamente, junto con la velocidad, en la 
misma gráfica. 


Solución Se puede usar primero la ecuación (E23.4.2) para generar algunos tiempos y algunas 
velocidades con espaciamiento desigual. Se puede entonces redondear estas velocidades de modo 
que se parezcan más a los valores medidos; es decir, no son exactas, 


>> format short yg 

>> t=[0 1 2 3 4.3 7 12 16]; 

>> g=9.81;m=70;c=12.5; 

>> v=round (g*m/c* (1-exp (-c/m*t)));5 


La distancia total se puede entonces calcular como 


>> y=trapz(t,v) 


y = 
789.6 
Así, después de 20 segundos, el paracaidista ha caído 789.6 m, que es razonablemente cercano a la 
solución exacta analítica de 799/73 m. 

Si se quiere tener la distancia recorrida acumulativa a cada momento, se puede usar cumtrapz 
para calcular 


>> yc=cumtrapz (t,v) 


0. 4.5 17 36.5 70.3 162.1 379.6 579.6 789.6 


Se genera una gráfica de soluciones numéricas y analíticas junto con velocidades exactas y re- 
dondeadas, con los siguientes comandos: 


>> ta=linspace (t (1),t (length (t))); 

>> ya=g*m/c*ta-g*m"2/c72* (1-exp (-c/m*ta)); 
>> plot (ta, ya,t,yc,'o') 

>> title('Distance versus time') 

>> xlabel('t (s)'),ylabel('x (m)') 

>> legend('analytical','numerical') 


Como en la figura 23.6, los resultados numéricos y analíticos coinciden bastante bien. 
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Finalmente, la función quad se puede usar para evaluar la integral con cuadratura adaptiva 
>> va=f (t) g*m/c* (1-exp (-c/m*t)); 
>> ya=quad (va, t (1),t (length (t))) 


ya = 
799.73 


Este resultado es idéntico a la solución analítica hasta dentro de los 5 dígitos que se muestran en 
pantalla. 


Como se lista en la tabla 23.15, MATLAB tiene diversas funciones incorporadas para evaluar 
derivadas, incluidas las funciones diff y gradient. Cuando se le pasa un vector unidimensional 
de longitud n, la función diff devuelve un vector de longitud n — 1 que contiene las diferencias 
entre elementos adyacentes. Esto se puede entonces usar para determinar aproximaciones con dife- 
rencia finita de primeras derivadas. 

La función gradient también devuelve diferencias. Sin embargo, lo hace de un modo más 
compatible con la evaluación de derivadas en los valores mismos que en los intervalos entre valores. 
La siguiente es una representación sencilla de su sintaxis: 


fx = gradient (f) 


donde £= un vector unidimensional de longitud n, y £x es un vector de longitud n que contiene las 
diferencias con base en £f. Igual que con la función diff, el primer valor devuelto es la diferencia 
entre el primer valor y el segundo. Sin embargo, para los valores intermedios, se devuelve una dife- 
rencia centrada basada en los valores adyacentes, 


Fira — fi 


diff, = 
ll 2 


Entonces se calcula el último valor como la diferencia entre los dos valores finales. Por lo tanto, los 
resultados equivalen a usar diferencias centradas para todos los valores intermedios con diferencias 
hacia adelante y hacia atrás en los extremos. 

Observe que se supone que el espaciamiento entre puntos es uno. Si el vector representa datos 
igualmente espaciados, la siguiente versión divide todos los resultados entre el intervalo y, por lo 
tanto, devuelve los valores reales de las derivadas, 


Distancia contra tiempo 


800 


700 


—— analítica 
e numérica 


Figura 23.6 

Gráfica de distancia contra tiempo. La línea se 
calculó con la solución analítica, mientras que los 
puntos se determinaron numéricamente con la 
función cumtrapz. 


tís! 
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fx = gradient(f, h) 
donde h =espaciamiento entre puntos. 


EJEMPLO 23.5 Uso de diff y gradient para diferenciación 


Planteamiento del problema Explore cómo se pueden usar las funciones diff y gradient 
de MATLAB para diferenciar la función f(x) = 0.2 + 25x — 200x? + 675x? — 900 x* + 400x* de x=0 
a 0.8. Compare sus resultados con la solución exacta: f'"(x) = 25 — 400x? + 20251? 3 600x* + 2000x*. 


Solución Se puede primero expresar f(x) como una función anónima 
>> f=0 (x) 0.2+25*x-200*x.%24+675*x."3-900*x.*4+400*x."%5;5 


Luego se genera una serie de valores igualmente espaciados de las variables independientes y de- 
pendientes, 


>> x=0:0.1:0.8; 
>> y=f(x);5 


La función diff es para determinar las diferencias entre elementos adyacentes de cada vector. Por 
ejemplo, 


>> format short yg 
>> diff (x) 
0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 0.1000 


Como se esperaba, el resultado representa la diferencia entre cada par de elementos de x. Para cal- 
cular aproximaciones de diferencia dividida de la derivada, simplemente se realiza una división 
vectorial de las diferencias de y entre las diferencias de x introduciendo 


>> d=diff (y) ./dif£ (x) 
10.89 -0.01 3.19 8.49 8.69 1.39 -11.01 -21.31 


Observe que, debido a que se están usando valores igualmente espaciados, después de generar los 
valores x, se podría simplemente haber realizado el cálculo anterior concisamente como 


>> d=diff (£(x))/0.1; 
El vector d contiene ahora estimados de derivada que corresponden al punto medio entre elementos 


adyacentes. Por lo tanto, con objeto de desarrollar una gráfica de los resultados, se debe primero 
generar un vector que contenga los valores x para el punto medio de cada intervalo. 


>> n=length(x); 
>> xm=(x(1:n-1)+x(2:n))./2; 


Se pueden calcular valores para la derivada analítica con un nivel más fino de resolución para in- 
cluirse en la gráfica para comparación 


>> xa=0:.01:.8; 
>> ya=25-400*xa+3*675*xa."2-4*900*xa."3+5*400*xa."4; 


Luego se genera una gráfica de los estimados numéricos y analíticos con 


subplot (1,2,1), plot (xm,d, 'o',xa, ya) 
xlabel('x') ylabel('y') 
legend ('numerical','analytical'),title(' (a) diff') 


Como se muestra en la figura 23.7a, los resultados de la aproximación numérica se comparan favo- 
rablemente con la solución analítica exacta para este caso. 
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a) diff b) gradient 
25 T 7 7 25 y T 7 
e numérica O ¡numérica 
20 analítica | 20 ¡analítica 


FIGURA 23.7 

Comparación de la derivada exacta (línea) 
con estimados numéricos (círculos) calcu- 
lada con las funciones a) diff y b) gra- 
dient de MATLAB. 


También se puede usar la función gradient para determinar las derivadas como 
>> dy=gradient (y,0.1) 
dy = 10.89 5.44 1.59 5.84 8.59 5.04 -4.81 -16.16 -21.31 


Como se hizo para la función diff, se puede también mostrar en una gráfica los estimados tanto 
numéricos como analíticos 


>> subplot (1,2,2), plot (x,dy, 'o',xa, ya) 
>> xlabel('x') 
>> legend('numerical','analytical'),title(' (b) gradient') 


Los resultados (figura 23.7b) no son tan exactos como los que se obtienen con la función diff 
(figura 23.7a). Esto se debe al hecho de que gradient utiliza intervalos que son el doble (0.2) de 
amplios que los que se usan para di££ (0.1). 


Más allá de los vectores unidimensionales, la función gradient es especialmente adecuada 
para determinar las derivadas parciales de matrices. Por ejemplo, para una matriz bidimensional, se 
puede llamar la función como 


[fx, fyl = gradient (f, h) 


donde £ es una matriz bidimensional, £x corresponde a las diferencias en la dirección x (columnas) 
y £y corresponde a las diferencias en la dirección y (hileras), y h = espaciamiento entre puntos. Si 
se omite h, el espaciamiento entre puntos en ambas dimensiones se supone que es uno. En la sección 
31.4.2 se ilustrará cómo se puede usar esta capacidad para visualizar campos vectoriales. 


23.6.2 Mathcad 


Mathcad tiene operadores que realizan integración y diferenciación numéricas. Estos operadores 
utilizan los mismos símbolos matemáticos tradicionales que usted ha empleado desde la preparato- 
ría O su primer semestre en la universidad, y se ven como dichos símbolos. 

El operador de integración usa una secuencia de evaluaciones de la integral por regla trapezoi- 
dal, y el algoritmo de Romberg. Se realizan iteraciones hasta que los resultados sucesivos varíen en 
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menos que la tolerancia. El operador de derivada utiliza un método similar para calcular derivadas 
de orden entre O y 5. Este operador crea una tabla de aproximaciones con base en cálculos de la 
derivada por diferencia dividida, usando varias órdenes y tamaños de paso. Se usan técnicas de 
extrapolación para estimar valores de un modo parecido al método de Richardson. 

La figura 23.8 muestra un ejemplo de Mathcad donde f(x) se crea usando el símbolo de defini- 
ción (:=) y luego se calcula la integral en un rango de x = 0 y x = 0.8. En este caso se usó el polino- 
mio simple que se evaluó en el capítulo 21. Observe que la gama definida por las variables a y b se 
introduce con el símbolo de definición. 

La figura 23.9 muestra un ejemplo de Mathcad donde una función f(x) se crea con el símbolo 
de definición (:=) y luego se calculan la primera y la tercera derivadas en un punto en el que x = 
—6. Observe que la ubicación del punto y el orden de la derivada se introducen con el símbolo de 
definición. 


“M'Mathcad 


ll File Edit View Insert Format Tools Symbolics Window Help 


NUMERICALLY CALCULATE INTEGRALS 
Enter a function: 


16) :=0.2+ 0.25-x — 200x?+675x% — 900-9+ 400-x? 


Enter integration interval: 
a:=0 
b:=0.8 


umerical integral: 
N gr Figura 23.8 


b Pantalla Mathcad para determi- 
f(=) dx=1.64053333 nar la integral de un polinomio 
a con integración Romberg. 


M' Mathcad 


MI File Edit View Insert Format Tools Symbolis Window Help 


NUMERICALLY CALCULATE DERIVATIVES 
Enter a function: 
160) :=2:x +3 + cos(x)* 
Enter a point to evaluate derivative: 
x:=-—6 
Compute the first derivative: 
109) :=1.46342708 


Compute the third derivative: 
n:=3 : 
Figura 23.9 
Pantalla Mathcad para imple- 
mentar diferenciación numérica. 


gr 
16%) :=2.14629167 
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PROBLEMAS 


23.1 Calcule las aproximaciones por diferencias hacia adelante y 
hacia atrás, de O(h) y O(13), y aproximaciones por diferencia central 
de O(h?) y O(h*) para la primera derivada de y = sen x, en x= 1/4, 
con el uso de un valor de h»= 71/12. Estime el error relativo porcentual 
verdadero e, para cada aproximación. 

23.2 Repita el problema 23.1, pero para y = log x evaluada en x = 25 
con h=2. 

23.3 Use aproximaciones por diferencias centradas para estimar las 
derivadas primera y segunda de y = e*en x= 2 para h = 0.1. Emplee las 
dos fórmulas de O(/?) y O(h*) para hacer sus estimaciones. 

23.4 Emplee la extrapolación de Richardson para estimar la prime- 
ra derivada de y = cos x en x= 7/4, con el uso de tamaños de paso de 
h, = 7/3 y h,= 11/6. Utilice diferencias centradas de O(»?) para las 
estimaciones iniciales. 

23.5 Repita el problema 23.4, pero para la primera derivada de In x 
enx=5,conh,=2yh,=1. 

23.6 Emplee la ecuación (23.9) para determinar la primera derivada 
de y = 2x* — 6x* — 12x- 8 en x= 0, con base en los valores de x, = 
0.5, x, = 1 y x,= 2. Compare este resultado con el valor verdadero 
y con una estimación obtenida con el uso de una aproximación por 
diferencias centradas con base en h = 1. 

23.7 Demuestre que para puntos de datos equidistantes, la ecuación 
(23.9) se reduce a la ecuación (4.22) en x= x,. 

23.8 Calcule las aproximaciones por diferencia central de primer 
orden de O(h*) para cada una de las funciones siguientes en la ubi- 
cación y con el tamaño de paso que se especifica: 


a) y=x+4x-15 enx=0, h=0.25 
b) y=x COS x en x=0.4, h=0.1 
c) y =tan (1/3) enx=3, h=0.5 
d) y=sen(0.5/x)/x enx=1, h=0.2 
e) y=e+x en x= 2, h=0.2 


Compare sus resultados con las soluciones analíticas. 
23.9 Para un cohete, se recabaron los datos siguientes de la distancia 
recorrida versus el tiempo: 


ts  |_0 25 50 75 100 125 
y.km | 0 32 58 78 92 100 


Use diferenciación numérica para estimar la velocidad y aceleración 
del cohete en cada momento. 

23.10 Desarrolle un programa amigable para el usuario a fin de 
aplicar el algoritmo de Romberg para estimar la derivada de una 
función dada. 

23.11 Desarrolle un programa amigable para el usuario, que obtenga 
estimaciones de la primera derivada para datos irregularmente espa- 
ciados. Pruébelo con los datos siguientes: 


Xx | 1 1.5 1.6 2.5 3.5 
Fx) | 0.6767 0.3734 0.3261 0.08422  0.01596 


donde Ax) =5e*x. Compare sus resultados con las derivadas verdaderas. 
23.12 Se dan los siguientes datos para la velocidad de un objeto como 
función del tiempo: 


ÉS | 0. 4 8 12 16 20 24 28 32 36 
y m/s po 34.7 618 82.8 992 112.0 1219 129.7 135.7 140.4 


a) Usando el mejor método numérico disponible, ¿qué tan lejos 
viaja el objeto desde £ = 0 hasta 28 s? 

b) Usando el mejor método numérico disponible, ¿cuál es la ace- 
leración del objeto a £ =28 s? 
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c) Usando el mejor método numérico disponible, ¿cuál es la ace- 
leración del objeto a t= 0 s? 
23.13 Recuerde que para el problema del paracaidista que desciende, 
la velocidad está dada por 


v(1) = EL (10m) (P23.13.1) 
Cc 
y la distancia recorrida se obtiene con 
a (P23.13.2) 
C 0 


Dadas g=9.81,m=70yc= 12, 

a) Use MATLAB o Mathcad para integrar la ecuación (P23.13.1), 
der=0a10. 

b) Integre la ecuación (P23.13.2) en forma analítica, con la con- 
dición inicial de que d =0 y £=0. Evalúe el resultado en £= 10 
para confirmar el inciso a). 

c) Emplee MATLAB o Mathcad para diferenciar la ecuación 
(P23.13.1) en 1= 10. 

d) Diferencie en forma analítica la ecuación (P23.13.1) ent1=10 
para confirmar el inciso c). 

23.14 La distribución normal se define como 


12 


y 
A 


a) Utilice MATLAB o Mathcad para integrar esta función de x = 
-1lal, y de-2a2. 

b) Use MATLAB o Mathcad para determinar los puntos de inflexión 
de esta función. 

23.15 Los datos siguientes se generaron a partir de la distribución 

normal: 


X 2 -1.,5 1 -0,5 0 
E) 0.05399 0.12952 0.24197 0.35207 0.39894 
Xx | 05 1 1.5 2 

0) [| 0.35207 0.24197 0.12952 0.05399 


a) Utilice MATLAB para integrar estos datos dex=-1a1ly-2a 
2, con la función trap. 
b) Emplee MATLAB para estimar los puntos de inflexión de estos 
datos. 
23.16 Evalúe 0//0x, 0//dy y Of(dxdy) para la siguiente función en x 
=y=1 a) analíticamente y b) numéricamente Ax = Ay = 0.0001. 


f(x, y) =3xy +3x —x* —3y? 
23.17 Escriba un programa en MATLAB que integre 


2/7 sen f 
J dt 
0 t 


con el uso de las funciones quad y quadl. Para aprender más acerca 
de quadl, escriba help quad1 en la barra de MATLAB. 

23.18 Use el comando di££ en MATLAB y calcule la aproximación 
por diferencia finita de la primera y segunda derivadas en cada valor 
de x de los que se muestran en la siguiente tabla, excepto los dos 
puntos extremos. Use aproximaciones por diferencias finitas que sean 
correctas en el segundo orden, O(Ax?). 


x | 0 1 2 33.4 5 6 7 8 9 10 
y [14 21 33 48 68 66 86 7.5 89 109 10 


23.19 El objetivo de este problema es comparar las aproximaciones 
por diferencias finitas de segundo orden exactas hacia delante, atrás 
y centradas, de la primera derivada de una función con el valor real 
de la derivada. Esto se hará para 


fo)=e*-x 
a) Use el cálculo para determinar el valor correcto de la derivada 
enx=2. 


b) Para evaluar las aproximaciones por diferencias finitas centradas, 
comience con x= 0.5. Así, para la primera evaluación, los valores 
de x para la aproximación por diferencias centradas seráx=2 + 
0.50 x= 1.5 y 2.5. Entonces, disminuya en pasos de 0.01 hacia 
abajo hasta un valor mínimo de Ax = 0.01. 

c) Repita el inciso b) para las diferencias de segundo orden hacia 
delante y hacia atrás. (Observe que esto se puede hacer al mismo 
tiempo que la diferencia centrada se calcula en el ciclo o loop.) 

d) Grafique los resultados de b) y c) versus x. Para efectos de 
comparación, incluya el resultado exacto en la gráfica. 

23.20 Use una expansión en series de Taylor para obtener una 
aproximación a la tercera derivada que tenga una exactitud de segun- 
do orden, por diferencias finitas centradas. Para hacer esto, tendrá 
que usar cuatro expansiones diferentes para los puntos x,_,, X,_,X,,, 
y Xx, ,, En cada caso, la expansión será alrededor del punto x;. El in- 
tervalo Ax se usará en cada caso de ¡-1 e ¡+ 1, y 2Ax se empleará en 
cada caso de ¡- 2 e ¿+2. Las cuatro ecuaciones deben combinarse 
en forma que se elimine las derivadas primera y segunda. Utilice 
suficientes términos en cada expansión para evaluar el primer térmi- 
no que se truncará a fin de determinar el orden de la aproximación. 
23.21 Use los datos siguientes para encontrar la velocidad y acele- 
ración en £= 10 segundos: 


Tiempo, t, s lo 2 4 6 ga 10 12 14 16 
Posición, x, m | 0.0.7 18 34 51 63 73 80 84 


Emplee los métodos de diferencias finitas correctas de segundo orden 
a) centradas, b) hacia adelante, c) hacia atrás. 

23.22 Un avión es seguido por radar, y se toman datos cada segundo 
en coordenadas polares 0 y r. 


ts 200 202 204 206 208 210 
9, (rad) 0.75 0.72 0.70 0.68 0.67 0.66 
r,m 5120 5370 5560 5800 6030 6240 


A los 206 segundos, utilice diferencias finitas centradas (correctas 

de segundo orden) para encontrar las expresiones vectoriales para la 
aii > : e 

velocidad v, y aceleración a. La velocidad y aceleración en coorde- 

nadas polares son: 


U=re+rbéo y  a=(i-r0%)e+(r0 +270)%0 


23.23 Desarrolle un programa de macros en Excel VBA para leer en 
columnas adyacentes de una hoja de cálculo los valores de x y y. 
Evalúe las derivadas en cada punto con el uso de la ecuación (23.9), 
y muestre los resultados en una tercera columna que se construya en 
la hoja, adyacente a las de los valores x y y. Pruebe su programa 
aplicándolo para evaluar las velocidades para los valores tiempo- 
posición del problema 23.21. 

23.24 Use regresión para estimar la aceleración en cada momento 
para los datos siguientes con polinomios de segundo, tercero y cuar- 
to grados. Grafique los resultados. 


col 1 2. 325 45 6 7 8 85 93 10 
vo [10 12 11. 14 17 16 12 14 14 10 
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23.25 Usted tiene que medir la tasa de flujo de agua a través de un 
tubo pequeño. Para ello, coloque una boquilla en la salida del tubo y 
mida el volumen a través de ella como función del tiempo, según se 
ha tabulado a continuación. Estime la tasa de flujo en 1=7 s. 


Tiempo, s | 0 1 5 8 
Volumen, cm? | 0 1 8 16.4 


23.26 Se mide la velocidad v (m/s) del aire que fluye por una super- 
ficie plana a distintas distancias, y (m) de la superficie. Determine el 
esfuerzo cortante T (N/m?) en la superficie (y = 0) usando la ley de 
viscosidad de Newton. 


ji dv 
dy 
Suponga un valor de viscosidad dinámica y =1.8 x 107 N - s/m?. 
y m | 0 0.002 0.006 0.0012 0.018 0.024 
v, m/s | 0 0.287 0.899 1.915 3.048 4.299 


23.27 Es frecuente que las reacciones químicas sigan este modelo: 


di 
E 
dt 


donde c = concentración, f= tiempo, k= tasa de reacción y n = or- 
den de reacción. Es posible evaluar valores dados de c y dc/dt, k y 
n, por medio de regresión lineal del logaritmo de esta ecuación: 


de 
log | —— | =1logk +nlogc 
g ( de ) g g 
Use este enfoque y los datos que siguen para estimar los valores de 
kyn: 


t | 10 20 30 40 50 60 
c | 3.52 2.48 175 123 087 0.61 


23.28 El perfil de velocidad de un fluido en un tubo circular se 
puede representar como 


r 1/n 
v= 10(1- = 
40) 


donde v = velocidad, r = distancia radial medida desde la línea axial 
del tubo, r, = radio del tubo y n = parámetro. Determine el flujo en 
el tubo si r,=0.75 y n=", usando a) integración de Romberg a una 
tolerancia de 0.1%, b) fórmula de dos puntos de Gauss-Legendre y 
c) la función quad de MATLAB. Observe que flujo = velocidad por 
área. 

23.29 La cantidad de masa transportada por un tubo en un periodo 
dado se puede calcular como 


M= 1 E O(Mc(tdt 


donde M = masa (mg), t, = tiempo inicial (min), £, = tiempo final 
(min), O(t) = caudal (m*/min) y c(t) = concentración (mg/m?). Las 
siguientes representaciones funcionales definen las variaciones tem- 
porales en flujo y concentración: 


O(t) = 9 + 4cos?(0.4t) 
(0) —- 5670-53 + 24-15 


Determine la masa transportada entre f, =2 y £, = 8 min, con a) in- 
tegración de Romberg a una tolerancia de 0.1% y b) función quad 
de MATLAB. 


Estudio de casos: integración 
y diferenciación numéricas 


El propósito del presente capítulo es aplicar los métodos de integración y diferenciación numérica, 
expuestos en la parte seis, a problemas prácticos de la ingeniería. Son dos situaciones que se pre- 
sentan con mayor frecuencia. En el primer caso, la función que modela un problema puede tener 
una forma analítica demasiado complicada para resolverse con los métodos del cálculo. En situa- 
ciones de este tipo, se aplican los métodos numéricos usando la expresión analítica para generar 
una tabla de valores de la función. En el segundo caso, la función que habrá de usarse en el cálcu- 
lo se halla en forma tabular. Este tipo de función generalmente representa una serie de mediciones, 
observaciones o alguna otra información empírica. Los datos para cualquiera de los casos son di- 
rectamente compatibles con los esquemas analizados en esta parte del libro. 

En la sección 24.1, que trata del cálculo de la cantidad de calor en la ingeniería química, se 
emplean ecuaciones. Aquí se integra numéricamente una función analítica para determinar el calor 
requerido para elevar la temperatura de un material. 

Las secciones 24.2 y 24.3 también usan funciones que están en forma de ecuación. La sección 
24.2, tomada de la ingeniería civil, emplea la integración numérica para determinar la fuerza del vien- 
to que actúa sobre el mástil de un velero de carreras. La sección 24.3 determina la raíz media cuadrá- 
tica de la corriente para un circuito eléctrico. Este ejemplo sirve para demostrar la utilidad de la 
integración de Romberg y de la cuadratura de Gauss. 

La sección 24.4 se concentra en el análisis de la información tabular para determinar el trabajo 
necesario para mover un bloque. Aunque esta aplicación tiene una vinculación directa con la inge- 
niería mecánica, se relaciona con todas las otras áreas de la ingeniería. Además, usamos este ejem- 
plo para ilustrar la integración de datos irregularmente espaciados. 


24.1 INTEGRACIÓN PARA DETERMINAR LA CANTIDAD TOTAL 
DE CALOR (INGENIERÍA QUÍMICA/BIOINGENIERÍA) 


Antecedentes En ingeniería química y en bioingeniería se emplean cálculos de la cantidad de 
calor en forma rutinaria, así como en muchos otros campos de la ingeniería. Esta aplicación ofrece 
un ejemplo simple, pero útil, de tales cálculos. 

La determinación de la cantidad de calor requerido para elevar la temperatura de un material es 
un problema con el que a menudo nos enfrentamos. La característica necesaria para llevar a cabo 
este cálculo es la capacidad calorífica c. Este parámetro representa la cantidad de calor requerida 
para elevar una unidad de masa en una unidad de temperatura. Si c es constante en el intervalo de 
temperaturas que se examinan, el calor requerido AH (en calorías) se calcula mediante 


AH =mc AT (24.1) 
donde c tiene unidades de cal/(g - *C), m= masa (g) y AT= cambio de temperatura (*C). Por ejemplo, 
la cantidad de calor necesaria para elevar la temperatura de 20 gramos de agua desde 5 hasta 10C es 
igual a: 

AH = 20()(010 — 5) = 100 cal 


donde la capacidad calorífica del agua es aproximadamente 1 cal/(g - *C). Este cálculo es adecuado 
cuando AT es pequeño. Sin embargo, para grandes cambios de temperatura, la capacidad calorífica 
no es constante y, de hecho, varía en función de la temperatura. Por ejemplo, la capacidad calorí- 
fica de un material podría aumentar con la temperatura de acuerdo con una relación tal como: 
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c(T) = 0.132 + 1.56 x 10*T + 2.64 x 1077? (24.2) 


En este caso se pide por ejemplo calcular el calor necesario para elevar la temperatura de 1000 
gramos de este material desde —100 hasta 200*C. 


Solución La ecuación (PT6.4) ofrece una manera para calcular el valor promedio de c(T): 


T 
j AT) dT 
ar) =% (243) — ———_——— 
LT, T,*C c, cal/(g - *C) 
que se sustituye en la ecuación (24.1) para dar: =100 0.11904 
A 50 0.12486 
2 
AH= m| (T) dT 244) 0 0.13200 
ñ 50 0.14046 
donde AT = T, — T,. Ahora como, en el caso actual, c(T') es una 100 0.15024 
función cuadrática, AH puede determinarse de manera analítica. 150 0.16134 
La ecuación (24.2) se sustituye en la ecuación (24.4) y después se 200 0.17376 


integra para dar un valor exacto, AH = 42732 cal. Es útil e ins- 
tructivo comparar este resultado con los métodos numéricos de- 
sarrollados en el capítulo 21. Para esto, es necesario generar una 
tabla de valores de c para distintos valores de 7, que se muestraa Tabla 24.1 Resultados usando la regla del trapecio 


la derecha. con varios tamaños de paso. 

Estos puntos se utilizan junto con una regla de Simpson 1/3 ____ 
con seis segmentos calculándose una estimación de la integral de Tamaño de paso, *C AH E (%) 
42732, este resultado se sustituye en la ecuación (24.4) para obtener 300 96048 125 
un valor de AH = 42732 cal, el cual concuerda exactamente con la 

mm em A da ab 150 43029 0.7 
solución analítica. Esta concordancia exacta ocurriría sin importar 
cuántos segmentos se utilicen. Se espera tal resultado debido a que 100 42864 9.3 
ces una función cuadrática y la regla de Simpson es exacta para 50 42765 0.07 
polinomios de tercer grado o menores (véase la sección 21.2.1). 25 42740 0.018 

Los resultados que se obtuvieron con la regla del trapecio se 10 427333 <0.01 
muestran en la tabla 24.1. Parece que la regla del trapecio es tam- 5 427323 Gn 
bién capaz de estimar el calor total de manera exacta. No obstan- 

é de a : 1 42732.01 <0.01 

te, se requiere un paso pequeño (< 109%C) para una exactitud de 
cinco cifras. El mismo cálculo también se puede implementar con 0.05 42 732.00003 <0.01 
software. Por ejemplo, MATLAB da 

>> m=1000; 

>> DH=m*quad(( (T) 0.132+1.56e-4*T+2.64e-7*T.*2,-100,200) 

DH = 

42732 


24.2 FUERZA EFECTIVA SOBRE EL MÁSTIL DE UN BOTE DE VELA 
DE CARRERAS (INGENIERÍA CIVIL/AMBIENTAL) 


Antecedentes Enla figura 24.1a se muestra la sección transversal de un bote de vela de carreras. 
Las fuerzas del viento (f), ejercidas por pie de mástil de las velas, varían en función de la distancia 
sobre la cubierta del bote (z), como se indica en la figura 24.1b. Calcule la fuerza de tensión T en el 
cable de soporte izquierdo del mástil, suponiendo que el cable de soporte derecho está totalmente 
flojo y que el mástil se une a la cubierta de modo que transmite fuerzas horizontales o verticales, 
pero no momentos. Suponga que el mástil permanece vertical. 


Solución Para resolver este problema, se requiere que la fuerza distribuida f se convierta en una 
fuerza total equivalente F y que se calcule su localización d sobre la cubierta (figura 24.2). Este 
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Cables de 
soporte 
del mástil 


Mástil 


ASSS5SS55SS5SSS OSOS SOS OSOS SOS SS > 


0 = tan”! (3/30) 
= 0.0996687 
Ta 


F = 1 480.6 lb 


d = 13.05 ft 
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Figura 24.1 

a) Sección transversal de un bote de vela de ca- 
rreras. b) Fuerzas del viento f ejercidas por pie de 
mástil en función de la distancia z sobre la cubierta 
del bote. 


+7 2=30ft 


cálculo se complica por el hecho de que la fuerza 


ejercida por pie de mástil varía con la distancia 
sobre la cubierta. La fuerza total ejercida sobre el 
mástil se expresa como la integral de una función 
Y z=0 continua: 


2 F= “200/) dz (24.5) 
0 5+z 

Esta integral no lineal es difícil de evaluar en 
forma analítica. Por lo tanto, en este problema es 
conveniente emplear procedimientos numéricos, 
como las reglas de Simpson y la del trapecio. Esto 
se lleva a cabo al calcular f(z) para diferentes 
valores de z y después utilizar la ecuación (21.10) 
o la (21.18). Por ejemplo, la tabla 24.2 tiene valores de f(z) para un tamaño de paso de 3 ft, que pro- 
porciona datos para la regla de Simpson 1/3 o para la regla del trapecio. Los resultados para varios 
tamaños de paso se muestran en la tabla 24.3. Se observa que ambos métodos dan un valor, F = 
1480.6 Ib conforme el tamaño de paso se va haciendo pequeño. Aquí, los tamaños de paso de 0.05 
ft para la regla del trapecio y de 0.5 ft para la regla de Simpson proporcionan buenos resultados. 


Tabla 24.2 Valores de f(z) para un tamaño de paso de 3 ft que proporcionan los datos para 
las reglas del trapecio y de Simpson 1/3. 


z, ft | 0 3 6 9 12 ls 18 21 24 27 30 


F(z),lo/ft | 0 61.40 73.13 70.56 63.43 55.18 47.14 39.83 33.42 27.89 23.20 


La distancia efectiva d en la que actúa la fuerza (figura 24.2) se calcula evaluando la in- 


tegral: 
30 
j ZD dz 
== (24.6) 
FO dz 
0 
10) 
30 
j 200212 /(5+2)1eWdz 
d=“% (24.7) 


1 480.6 


Esta integral puede evaluarse usando métodos similares a los anteriores. Por ejemplo, la regla 
de Simpson 1/3 con tamaño de paso 0.5 da d = 19326.9/1 480.6 = 13.05 ft. 

Conocidos F y d mediante los métodos numéricos, ahora se emplea un diagrama de 
cuerpo libre para desarrollar ecuaciones de balance de fuerza y de momento. El diagrama 


Figura 24.2 
Diagrama de cuerpo libre de las fuerzas ejercidas sobre el mástil de un velero. 


24.3 Raíz media cuadrática de la corriente mediante integración numérica (ingeniería eléctrica) 


de cuerpo libre se muestra en la figura 24.2. Sumando fuerzas en las direcciones vertical y horizon- 
tal, y tomando momentos respecto al punto O se obtiene: 


NFy=0=F-Tsen0-H (24.8) 
YNFy=0=V-Tcos 0 (24.9) 
YM, =0=3V-Fd (4.10) 


donde T'= la tensión en el cable y H y V = las reacciones desconocidas sobre el mástil transmitidas 
por la cubierta. Tanto la dirección como la magnitud de H y V son desconocidas. De la ecuación (24.10) 
se despeja directamente V, puesto que se conocen F y d: 


_ Fd _ (1480.61(13.05) 


VA =6 440.6 lb 
3 3 
Por lo tanto, a partir de la ecuación (24.9): 
_V _6440.6 -64731b 
cosg 0.995 


y de la ecuación (24.8): 
H=F-Tsen0=1480.6 — (647310.0995) = 836.54 lb 


Ahora el conocer estas fuerzas nos permite continuar con otros aspectos del diseño estructural del 
bote, como los cables y el sistema de soporte del mástil en la cubierta. Este problema ilustra clara- 
mente dos usos de la integración numérica que pueden encontrarse en el diseño de estructuras en 
ingeniería. Se ve que ambas reglas, la del trapecio y la de Simpson 1/3, son fáciles de aplicar y 
constituyen herramientas prácticas en la solución de problemas. La regla de Simpson 1/3 es más 
exacta que la del trapecio para el mismo tamaño de paso, por lo que a menudo se prefiere aquélla. 


24.3 RAÍZ MEDIA CUADRÁTICA DE LA CORRIENTE MEDIANTE 
INTEGRACIÓN NUMÉRICA (INGENIERÍA ELÉCTRICA) 


Antecedentes El valor promedio de una corriente eléctrica oscilante en un periodo puede ser 
cero. Por ejemplo, suponga que la corriente se describe por una senoide simple: ¡(t) = sen (xt/T), 
donde T es el periodo. El valor promedio de esta función se determina mediante la siguiente ecuación: 


Tabla 24.3 Valores de F calculados con base en las diferentes versiones de las reglas del 
trapecio y de Simpson 1/3. 


Técnica Tamaño de paso, ft Segmentos F, lb 


Regla del trapecio 15 2 001.7 
10 3 222.3 

6 5 3123 

3 10 450.8 

1 30 477.1 

0:5 60 479.7 

0.25 120 480.3 

0.1 300 480.5 

0.05 600 480.6 

Regla de Simpson 1/3 15 2 219.6 
5 6 462.9 

3 10 476.9 

1 30 480.5 

0.5 60 480.6 


529 


530 Capítulo 24 Estudio de casos: integración y diferenciación numéricas 


T 
¡ t 
14 Para0 <= 1 < T/, (1) = 10e "Usen [275 j sen ES dt 
Para 7/2 <t=T, i(t)=0 7) ¡-% T _ COS Qm)+cos0 _, 


T-0 T 


A pesar del hecho de que el resultado total es cero, dicha co- 
rriente es capaz de realizar trabajo y generar calor. Por consiguien- 
te, los ingenieros eléctricos a menudo caracterizan esa corriente 


por: 
1 T 

o +] P(0) dt (24.11) 
To 


donde ¿(t) =la corriente instantánea. Calcule la RMC o raíz media 
cuadrática para la corriente que tiene la forma de onda mostrada en 
la figura 24.3, mediante la regla del trapecio, la regla de Simpson 
1/3, la integración de Romberg y la cuadratura de Gauss paraT'=1 s. 


0 T/4 TN t : 
Solución En la tabla 24.4 se presentan las estimaciones de la 


integral para varias aplicaciones de la regla del trapecio y de la re- 
gla de Simpson 1/3. Observe que la regla de Simpson es más exac- 
ta que la del trapecio. 

El valor exacto de la integral es 15.41261. Este resultado se 
obtiene utilizando la regla del trapecio con 128 segmentos, o la 
regla de Simpson con 32 segmentos. Se determina también la mis- 
ma estimación usando la integración de Romberg (figura 24.4). 

Además, la cuadratura de Gauss también se utiliza para hacer la misma estimación. La determi- 
nación de la raíz media cuadrática para la corriente implica la evaluación de la integral (con T'= 1): 


Figura 24.3 
Una corriente eléctrica que varía en forma periódica. 


1/2 


I=| (10e “sen 271) dt (24.12) 
0 


Primero, se efectúa un cambio de variable aplicando las ecuaciones (22.29) y (22.30) para obtener: 


1 1 1 
l=—+-—1 dt =—dt 
4 4“ 4? 


Esas relaciones se sustituyen en la ecuación (24.12) para obtener: 
2 
! -[1/4+(1/4)14] 1 1 1 
1=| 10€ al sen2al +1, || di (24.13) 
1 4 4 4 


En la fórmula de Gauss-Legendre con dos puntos, esta función se evalúa en f,¿ = —1/ /3 y 
1/43, y los resultados son 7.684096 y 4.313728, respectivamente. Tales valores se sustituyen en la 


O(h?) O(h*) O(h*) O(h*) O(h1) O(h1?) 


0 20.21769 15.16503 15.41502 15.41261 15.41261 
15.16327 15.48082 15.41111 15.41262 15.41261 

15.40143 15.41547 15.41225 15.41261 

15.41196 15.41277 15.41261 

15.41257 15.41262 

15.41261 

Figura 24.4 


Resultados al usar la integración de Romberg para estimar la RMC de la corriente. 


24.4 Integración numérica para calcular el trabajo (ingeniería mecánica/aeronáutica) 


Tabla 24.4 Valores para la integral calculados con diversos esquemas numéricos. El error 
relativo porcentual e, se basa en el valor verdadero, 15.41261. 


Técnica Segmentos Integral Er (%) 
Regla del trapecio 1 0.0 100 
2 5.16327 1.62 
4 5.40143 0.0725 
8 5.41196 4.21 x 107? 
16 5.41257 2.59 x 10% 
32 5.41261 1.62 x 10 
64 15.41261 1.30 x 107 
128 15.41261 0 
Regla de Simpson 1/3 2 20.21769 31.2 
4 5.48082 0.443 
8 5.41547 -0.0186 
16 15.41277 1.06 x 103 
32 15.41261 0 
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ecuación (22.23) para obtener un estimado de la integral de 11.99782, que Tabla 24.5 Resultados al usar las 
representa un error de e, = 22.1%. fórmulas de la cuadratura de 


La fórmula de tres puntos es (tabla 22.1): 
I=0.5555556(1.237449) + 0.8888889(15.16327) + 0.5555556(2.684915) 


=15.65755 — le,l = 1.6% Puntos 


Gauss con varios puntos para 
estimar la integral. 


Estimación E(%) 
Los resultados al emplear las fórmulas con más puntos se resumen en la tabla 2 11.9978243 22.1 
24.5. 3 15.6575502 -1.59 
; DS j ] e 2 
La estimación de la integral, 15.41261, se sustituye en la ecuación (24.12) A pincicn al 
ñ y 5 15.4126391 2.01 x 10% 
para calcular Igyc = 3.925890 A. El resultado sirve, como guía para otros 6 


15.4126109 


-1.82 x 107% 


aspectos del diseño y la operación del circuito. a o 


24.4 INTEGRACIÓN NUMÉRICA PARA CALCULAR EL TRABAJO 
(INGENIERÍA MECÁNICA/AERONÁUTICA) 


Antecedentes En ingeniería muchos problemas implican el cálculo del trabajo. La fórmula ge- 
neral es: 


Trabajo = fuerza X distancia 


Cuando se le presentó este concepto en sus cursos de física en el nivel medio superior, se le mostra- 
ron algunas aplicaciones simples mediante el uso de fuerzas que permanecían constantes durante 
todo el desplazamiento. Por ejemplo, si una fuerza de 10 lb se usaba para jalar un bloque a través de 
una distancia de 15 ft, el trabajo que se obtiene con esta fórmula es 150 ft - lb. 

Aunque ese simple cálculo es útil para presentar el concepto, la solución de problemas reales 
por lo común es más complicada. Por ejemplo, suponga que la fuerza varía durante el proceso del 
cálculo. En tales casos, la ecuación para el trabajo ahora se expresa como 


W= fro de (24.14) 


donde W = trabajo (ft - 1b), xy y x, = las posiciones inicial y final, respectivamente, y F(x) es una 
fuerza que varía con la posición. Si F(x) es fácil de integrar, la ecuación (24.14) se puede resolver en 
forma analítica. No obstante, en la solución de un problema real, quizá la fuerza no se exprese de 
esa manera. De hecho, cuando se analizan los datos obtenidos de mediciones, la fuerza podría estar 
disponible sólo en forma tabular. En tales casos, la integración numérica es la única opción viable 
para la evaluación. 
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FO) FO) 


Xo Xx 


x, ft 


(0) 30 
de 1 


Figura 24.5 

El caso de una fuerza variable que actúa sobre un bloque. 
Para este caso, tanto el ángulo como la magnitud de la fuer- 
za varían. 


F(x) cos [6 (x)] 


Figura 24.6 

Una gráfica continua de F(x) cos [6(x)] contra la posición 
con los siete puntos discretos usados para las estimaciones 
de la integral numérica dadas en la tabla 24.7. Observe 
cómo el uso de los siete puntos para caracterizar esta fun- 
ción que varía en forma continua deja fuera dos picos en 
x=2.5y12.5ft. 


Se obtiene mayor complejidad si el ángulo entre la fuerza y la 
dirección del movimiento también varía en función de la posición 
(figura 24.5). La ecuación del trabajo llega a dificultarse aún más 
al tomar en cuenta este efecto, entonces 


W= fro cos [O(x)] dx (24.15) 


De nuevo, si F(x) y O(%) son funciones sencillas, la ecuación (24.15) 
se podría resolver de manera analítica. Sin embargo, como se repre- 
senta en la figura 24.5, es más común que la relación funcional sea 
complicada. En tal situación, los métodos numéricos ofrecen la única 
alternativa para determinar la integral. 

Suponga que usted debe realizar el cálculo para la situación que 
se muestra en la figura 24.5. Aunque la figura indica los valores con- 
tinuos de F(x) y 0(x), considere que, debido a las restricciones expe- 
rimentales, usted cuenta sólo con mediciones discretas a intervalos 
dex=5 ft (tabla 24.6). Utilice versiones de una y múltiples aplicacio- 
nes de la regla del trapecio, y de las reglas de Simpson 1/3 y 3/8 para 
calcular el trabajo con estos datos. 


Solución Los resultados del análisis se resumen en la tabla 
24.7. Se calculó un error relativo porcentual e, con referencia al 
valor verdadero de la integral, 129.52, cuya estimación se realizó 
con base en los valores tomados de la figura 24.5 a intervalos de 
1 ft. 

Los resultados son interesantes, puesto que la mayor exacti- 
tud se obtiene en una aplicación de la regla del trapecio con dos 
segmentos. Las estimaciones más refinadas que utilizan más 
segmentos, así como las reglas de Simpson, dan resultados menos 
exactos. 

La razón de este resultado, ilógico en apariencia, es porque 
el espaciamiento de los puntos no es el adecuado para captar las 
variaciones de las fuerzas y de los ángulos, lo cual es evidente 
en la figura 24.6, donde graficamos la curva continua del pro- 
ducto de F(x) por cos [0(x)]. Observe cómo el uso de siete puntos 
para caracterizar la variación continua de la función omite dos 
picos en x=2.5 y 12.5 ft. La omisión de estos dos puntos efecti- 
vamente limita la exactitud de la estimación de la integración 
numérica dada en la tabla 24.7. El hecho de que la regla del tra- 
pecio con dos segmentos dé el resultado más exacto se debe a la 
posición casual de los puntos usados en este problema específico 
(figura 24.7). 


Tabla 24.6 Datos para la fuerza F(x) y el ángulo 0(x) 
como función de la posición x. 


X, ft Fo, lb 60, rad Fx) cos O 
0 0.0 0.50 0.0000 

5 9.0 1.40 1.5297 
10 13.0 075 9.5120 
15 14.0 0.90 8.7025 
20 10.5 1.30 2.8087 
25 12.0 1.48 1.0881 


30 5.0 1.50 0.3537 
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Tabla 24.7 Estimaciones del trabajo calculado usando la 


regla del trapecio y las reglas de Simpson. El 4 Subestimados 
error relativo porcentual e,, como se calculó con 
referencia a un valor verdadero de la integral 10 
(129.52 Ib - ft), se estimó con base en los valores E 
en intervalos de 1 ft. SS 
: 
Técnica Segmentos Trabajo En % S 
[A 
Regla del trapecio 1 5.31 95.9 
2 33.19 2.84 
3 24.98 3.51 Sobrestimados 
6 19.09 8.05 0 Es 
; 0 30 
Regla de Simpson 1/3 2 75.82 -35.75 x, ft 
6 17.13 9.57 
Regla de Simpson 3/8 3 39.93 -8.04 Figura 24.7 


Representación gráfica del porqué la regla del trapecio con 
dos segmentos da una buena estimación de la integral 

La conclusión a partir de la figura 24.6 es que debe realizar- en este caso específico. Casualmente, el uso de dos tra- 
se un número adecuado de mediciones para calcular las integra-  Pe20ides lleva a un equilibrio entre los errores negativo y 
les con exactitud. En el presente caso si se tuvieran los datos en PeSuIva: 
F(Q.5) cos [0(2.5)] = 4.3500 y F(12.5) cos [0(12.5)] = 11.3600, 
podríamos determinar una estimación de la integral utilizando 
el algoritmo para datos irregularmente espaciados que se descri- 
bió en la sección 21.3. La figura 24.8 ilustra la segmentación 
irregular en este caso. Si se incluyen dos puntos adicionales se 10 
obtiene una mejor estimación de la integral: 126.9 (e, = 2.02%). 
Así, la inclusión de datos adicionales incorporaría los picos que 
antes no se tomaron en cuenta y, en consecuencia, se tendrían 
mejores resultados. 


F (x) cos [0 (x)] 


77 008 


D 


SS 


0 ! I 
0 30 x 
Figura 24.8 OS DS y 2 
El esquema con segmentos irregulares que resulta de incluir dos S S SS 
puntos adicionales en x= 2.5 y 12.5 a los datos de la tabla 24.6. S 9 S S 
Se muestra la aplicación de las fórmulas de integración numérica a E ] E E 
cada conjunto de segmentos. e E D ó 


PROBLEMAS 


Ingeniería química/biológica ta 
24.1 Realice el mismo cálculo que en la sección 24.1, pero obtenga si f Qc dt 
la cantidad de calor requerido para elevar la temperatura de 1200 g 


del material, de -150 a 100%C. Use la regla de Simpson para hacersu donde, y £, = tiempos inicial y final, respectivamente. Esta fórmu- 


cálculo, con valores de T en incrementos de 50*C, la es de sentido común si se recuerda la analogía entre la integración 


24.2 Repita el problema 24.1, pero utilice la integración de Romberg y la suma. Es decir, la integral representa la suma del producto del 
con e, = 0.01%. flujo por la concentración, lo que da la masa total que entra o sale 
24.3 Vuelva a hacer el problema 24.1, pero emplee una fórmula de de f, a £,. Si la tasa de flujo es constante, O se puede sacar de la 
Gauss-Legendre de dos y tres puntos. Interprete sus resultados. integral: 

24.4 La integración proporciona un medio de calcular cuánta masa 

entra o sale de un reactor durante un periodo específico de tiempo, M=0 j a dt 


h (P24.4.1) 
asl 
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Utilice integración numérica para evaluar esta ecuación para los datos 
que se enlistan a continuación. Observe que Q = 4 m'/min. 


t, min | 0 10 20 30 35 40 45 50 


| 10. 35 55 52 40 37 32 34 


c, mg/m? 


24.5 Use integración numérica para calcular cuánta masa sale de un 
reactor con base en las siguientes mediciones: 


t, min 0 10 20 30 35 40 45 50 
Q, m/min 4 4.8 5.2 5.0 4.6 4.3 4.3 5.0 
c, mg/m? 10 35 55 52 40 37 32 34 


24.6 La primera ley de la difusión de Fick establece que 


d . 
Flujo de masa = —D a 
dx 


(P24.6.1) 


donde el flujo de masa = cantidad de masa que pasa a través de una 
unidad de área por unidad de tiempo (g/cm?/s), D = coeficiente de 
difusión (cm?/s), c = concentración y x= distancia (cm). Un ingenie- 
ro ambiental mide la concentración, que se presenta a continuación, 
de un contaminante en los sedimentos en el fondo de un lago (x=0 
en la interfase sedimento-agua y aumenta hacia abajo): 


x, cm | 0 1 3 
| 0.06 0.32 0.6 


Cc, 1078 g/cm? 


Utilice la mejor técnica numérica de diferenciación disponible para 
estimar la derivada en x = 0. Emplee esta estimación junto con la 
ecuación (P24.6.1) para calcular el flujo de masa del contaminante 
que se desprende de los sedimentos hacia las aguas superiores (D = 
1.52 x 10% cm?Ys). Para un lago con 3.6 x 10% m? de sedimentos, 
¿cuánto contaminante será transportado hacia el lago durante un año? 
24.7 Los siguientes datos se obtuvieron al cargar un gran buque 
petrolero: 


t, min | 0 10. 20 30 45 60 75 
V, 10% barriles | 04 07 077 088 105 117 135 


Calcule la tasa de flujo O (es decir, dV/dt) para cada tiempo con un 
orden de h?. 

24.8 Usted está interesado en medir la velocidad de un fluido a 
través de un canal rectangular angosto abierto que conduce desper- 
dicios de petróleo entre distintos lugares de una refinería. Usted sabe 
que, debido a la fricción con el fondo, la velocidad varía con la pro- 
fundidad del canal. Si los técnicos sólo disponen de tiempo para 
hacer dos mediciones de la velocidad, ¿a qué profundidades las haría 
para obtener la mejor estimación de la velocidad promedio? Elabore 
recomendaciones en términos del porcentaje total de profundidad d 
medida a partir de la superficie del fluido. Por ejemplo, si se midiera 
en la superficie se tendría 0%d, mientras que en el fondo sería 100%d. 
24.9 El tejido suave sigue una deformación de comportamiento 
exponencial ante la tensión uniaxial, mientras se encuentre en el 
rango fisiológico o normal de elongación. Esto se expresaría así: 


donde gd = esfuerzo, e = tensión, y E, y a son constantes materiales 
que se determinan en forma experimental. Para evaluar las dos cons- 
tantes materiales, se deriva la ecuación anterior con respecto a e, la 
cual es una relación fundamental para el tejido suave: 
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d 
2 E, +a0 
de 


Para evaluar E, y a, se emplean datos de esfuerzo-tensión para graficar 
do/de versus 0, y la pendiente e intersección de esta gráfica son las dos 
constantes del material, respectivamente. La tabla siguiente contie- 
ne datos de esfuerzo-tensión para las cuerdas tendinosas del corazón 
(tendones pequeños que durante la contracción del músculo cardiaco 
mantienen cerradas sus válvulas). Éstos son datos tomados durante la 
carga del tejido, se obtendrían curvas distintas durante la descarga. 


0 x 103 Nim? | 878 966 176 263 350 569 833 
ex 10%m/m | 153 198 270 320 355 410 460 
o x 103 Nim? | 1227 1623 2105 2677 3378 4257 
ex 107 m/m | 512 562 614 664 716 766 


a) Calcule la derivada de do/de por medio de diferencias finitas con 
exactitud de segundo orden. Grafique los datos y elimine aquellos 
puntos cerca de cero que parezcan no seguir la relación de línea 
recta. El error en dichos datos proviene de la incapacidad de los 
instrumentos para medir los valores pequeños en dicha región. 
Lleve a cabo un análisis de regresión de los demás puntos para 
determinar los valores de E, y a. Grafique los datos de esfuerzo 
versus tensión junto con la curva analítica expresada por la pri- 
mera ecuación. Esto indicará qué tan bien se ajustan los datos a 
la curva analítica. 

b) Es frecuente que el análisis anterior no funcione bien debido a 
que es difícil evaluar el valor de £,.. Para resolver este problema, 
no se utiliza E,. Se selecciona un punto (a, e) de los datos que 
esté a la mitad del rango empleado para el análisis de regresión. 
Estos valores se sustituyen en la primera ecuación y se determina 
un valor Ey/a que se reemplaza en la primera ecuación: 


je -1) 


Con este enfoque, los datos experimentales que están bien definidos 
producirán un buen ajuste entre los datos y la curva analítica. Emplee 
esta nueva relación y grafique otra vez los datos del esfuerzo versus 
la tensión y también la nueva curva analítica. 

24.10 La técnica estándar para determinar el gasto cardiaco es el 
método de dilución de un colorante, desarrollado por Hamilton. Se 
inserta el extremo de un catéter pequeño en la arteria radial, y el otro 
se conecta a un densitómetro, que registra en forma automática la 
concentración del colorante en la sangre. Se inyectó con rapidez una 
cantidad conocida, 5.6 mg, de colorante y se obtuvieron los datos 
siguientes: 


Concentración, 


Tiempo, Concentración, Tiempo, 

s mg/L s mg/L 
5 0 21 2.3 
7 0.1 23 1.1 

9 0.11 25 0.9 
11 0.4 27 1.75 
13 4.1 29 2.06 
15 9.1 31 2.25 
17 8 33 2.32 
19 4.2 35 2.43 


Al graficarse los datos anteriores se obtiene la curva de dilución del 
colorante que se muestra en la figura P24.10a. La concentración al- 
canza un valor máximo alrededor de 15 segundos después, luego hay 


una disminución seguida de un aumento ocasionado por la recircu- 
lación del colorante. En la figura P24.10b, se muestra la curva gra- 
ficada en escala semilogarítmica. Observe que la rama descendente 
de la curva de dilución se aproxima a una línea recta. A fin de sepa- 
rar el efecto de recirculación, los analistas extienden la porción de 
la línea recta. Entonces, el gasto cardiaco se calcula por medio de la 
ecuación siguiente: 


A 
A 


donde C = gasto cardiaco (L/min), M= cantidad de colorante inyec- 
tado (mg) y A = área bajo la curva con la corrección lineal. Calcule 
el gasto cardiaco de este paciente con el empleo de la regla del tra- 
pecio con un tamaño de paso de 2 s. 
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Figura P24.10 


24.11 En todo el mundo, el glaucoma es la segunda causa principal 
de pérdida de la vista. La presión intraocular alta (presión dentro del 
ojo) casi siempre acompaña la pérdida de la visión. Existe la hipóte- 
sis de que la presión elevada daña un subconjunto de células en el 
ojo responsables de la vista. Un investigador postula que la relación 
entre la pérdida de la visión y la presión está descrita por la ecuación: 


VL=A exo[£/ (P-13) ae 
25 
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donde VL es el porcentaje de pérdida de visión, P es la presión intra- 
ocular (mm de mercurio [mm Hg]), £ es el tiempo (años), y k y A son 
constantes. Con el uso de los datos siguientes procedentes de tres 
pacientes, estime los valores de las constantes k y A. 


Paciente A 
Edad al emitir el diagnóstico 65 
VL 60 
Edad, años P, mm Hg 
25 13 
40 15 
50 22 
60 23 
65 24 
Paciente B C 
Edad al emitir el diagnóstico 43 80 
VL 40 30 
Edad, P, Edad, P, 
años mmHg años mmHg 
25 11 25 13 
40 30 40 14 
41 32 50 15 
42 33 60 17 
43 35 80 19 


24.12 Una de sus colegas diseñó un parche transdérmico nuevo para 
aplicar insulina a través de la piel de los pacientes diabéticos en forma 
controlada, con lo que se elimina la necesidad de inyecciones doloro- 
sas. Recabó los datos siguientes acerca del flujo de masa de la insulina 
que se aplica a través del parche (y piel) como función del tiempo: 


Flujo, Tiempo, Flujo, Tiempo, 
mg/cm?/h h mg/cm?/h h 
15 0 8 5 
14 1 5 10 
12 2 2.5 15 
11 3 2 20 
9 4 1 24 


Recuerde que el flujo de masa es la tasa de flujo a través de un área, 
o (1/A)dm/dt. Proporcione su mejor estimación posible de la cantidad 
de medicina distribuida a través de la piel en 24 horas de uso de un 
parche de 12 cm?. 

24.13 Se emplea la videoangiografía para medir el flujo sanguíneo 
y determinar el estado de la función circulatoria. A fin de cuantificar 
los videoangiogramas, se necesita conocer el diámetro del vaso 
sanguíneo y la velocidad de la sangre, de modo que se determine el 
flujo total de la sangre. A continuación se presenta el perfil densito- 
métrico tomado de un videoangiograma de cierto vaso sanguíneo. 
Una forma de determinar de modo consistente a qué distancia del 
angiograma se localiza el borde del vaso sanguíneo, es determinar la 
primera derivada del perfil en un valor extremo. Con los datos que 
se proporcionan, encuentre las fronteras del vaso sanguíneo y estime 
el diámetro de éste. Emplee fórmulas de diferencias centradas tanto 
de O(/?) como de O(h*) y compare los resultados. 
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Distancia Densidad Distancia Densidad 
0 26.013 28 38.273 
4 26.955 32 39.103 
8 26.351 36 39.025 
12 28.343 40 39.432 
16 31.100 44 39.163 
20 34.667 48 38.920 
24 37.251 52 38.631 
Distancia Densidad Distancia Densidad 
56 39.124 84 37.331 
60 38.813 88 35.980 
64 38.925 92 31.936 
68 38.804 96 28.843 
72 38.806 100 26.309 
76 38.666 104 26.146 
80 38.658 


. 


Ingeniería civil /ambiental 

24.14 Ejecute el mismo cálculo que en la sección 24.2, pero utilice 
integración de Romberg O(%) para evaluar la integral. 

24.15 Lleve a cabo el mismo cálculo que en la sección 24.2, pero 
emplee la cuadratura de Gauss para evaluar la integral. 

24.16 Igual que en la sección 24.2, calcule el valor de F con el uso 
de la regla del trapecio y las de Simpson 1/3 y 3/8, pero utilice la 
fuerza siguiente. Divida el mástil en intervalos de cinco pies. 


F= 202502 o dz 
0 6+z 


24.17 Las áreas (A) de la sección transversal de una corriente se 
requieren para varias tareas de la ingeniería de recursos hidráulicos, 
como el pronóstico del escurrimiento y el diseño de presas. A menos 
que se disponga de dispositivos electrónicos muy avanzados para 
obtener perfiles continuos del fondo del canal, el ingeniero debe 
basarse en mediciones discretas de la profundidad para calcular A. 
En la figura P24.17 se representa un ejemplo de sección transversal 
común de una corriente. Los puntos de los datos representan ubica- 
ciones en las que ancló un barco y se hicieron mediciones de la 
profundidad. Utilice aplicaciones (h = 4 y 2 m) de la regla del trape- 
cio y de la de Simpson 1/3 (h =2 m) para estimar el área de la sección 
transversal representada por esos datos. 


24.18 Como se dijo en el problema 24.17, el área de la sección 
transversal de un canal se calcula con: 


B 
A.=f, HOdy 
donde B = ancho total del canal (m), A = profundidad (m) y y = 


distancia desde uno de los márgenes (m). En forma similar, el flujo 
promedio Q (m*/s) se calcula por medio de: 


0= f. UNANAy. 


donde U = velocidad del agua (m/s). Use estas relaciones y algún 
método numérico para determinar A, y O, para los datos siguientes: 


y  m 0 2 4 5 6 9 
H,m 0.5 1.3 1.25 1: 1 0.25 
U, m/s 0.03 0.06 0.05 0.12 0.11 0.02 


24.19 Se pueden usar las siguientes relaciones para analizar vigas 
uniformes sujetas a cargas distribuidas: 
dy do MG) dM 


dV 
ec" a "a 


donde x = distancia a lo largo de la viga (m), y = deflexión (m), 0(x) 
= pendiente (m/m), E = módulo de elasticidad (Pa = N/m?), /=mo- 
mento de inercia (m*), M(x) = momento (N m), V(x) = cizalladura 
(N) y w(x) = carga distribuida (N/m). Para el caso de una carga li- 
nealmente creciente (recuerde la figura P8.18), la pendiente se puede 
calcular analíticamente como 


wo 4 2,2 4 
dh AE E 
TIT ) 


(P24.19.1) 


Use a) integración numérica para calcular la deflexión (en m), y b) 
diferenciación numérica para calcular el momento (en N m) y la ci- 
zalladura (en N). Base sus cálculos numéricos en valores de la pen- 
diente calculados con la ecuación (P24.19.1) a intervalos igualmente 
espaciados de Ax = 0.125 m a lo largo de una viga de 3 m. Use los 
siguientes valores de parámetros en su cálculo: E = 200 GPa, / = 
0.0003 m* y w, =2.5 kN/cm. Además, las deflexiones en los extremos 
de la viga se establecen en y(0) = y(L) = 0. Tenga cuidado con las 
unidades. 


24.20 Usted mide las siguientes deflexiones a lo largo de una viga 
uniforme con un solo apoyo (véase el problema 24.19). 


Profundidad, m 
p 
| 


td» ILIILL, 


20) 
2 
>, 
2 
2 
< BZ 
O 


Figura P24.17 
Sección transversal de una corriente. 


10 20 


Distancia desde el margen izquierdo, m 


x, m 0 0.375 0.75 1.125 1.5 1.875 
y cm | O  -0.2571 0.9484 -1.9689 — -3.2262 -4.6414 
x, m | 2,25 2.625 E 


y, cm | 6.1503 7.7051 -9.275 


Utilice diferenciación numérica para calcular la pendiente, el mo- 
mento (en N m), la fuerza cortante (en N) y la carga distribuida (en 
N/m). Use los siguientes valores de parámetros en su cálculo: E = 
200 GPa e /= 0.0003 m*. 

24.21 Un estudio de ingeniería del transporte requiere que se calcu- 
le el número total de autos que cruzan por una intersección en un 
periodo de 24 horas. Un individuo la visita en diferentes momentos 
durante el curso de un día y cuenta durante un minuto los autos que 
pasan por la intersección. Utilice los datos que se resumen en la tabla 
P24.21 para estimar el número total de autos que cruzan por día 
(tenga cuidado con las unidades). 

24.22 Se midió la fuerza del viento distribuida contra el costado de 
un rascacielos, obteniendo: 


Altura, /, m 0 30 60 90 120 150 180 
Fuerza, F(/), N/m 0 340 1200 1600 2700 3100 3200 
Altura, /, m 210 240 
Fuerza, F(/), N/m 3500 3800 


Calcule la fuerza neta y la línea de acción debida a este viento dis- 
tribuido. 
24.23 El agua ejerce presión sobre el parámetro de una presa, como 


se ilustra en la figura P24.23. La presión se describe con la ecuación: 
p(2)=pg(D - 2) (P24.23.1) 


donde p(z) es la presión en Pascales (o N/m?) que se ejerce a z metros 
de elevación sobre el fondo de la presa; p = densidad del agua, que 
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para este problema se supone ser constante de 10% kg/m?; g = ace- 
leración de la gravedad (9.8 m/s?), y D = elevación (en m) del agua 
desde el fondo de la presa hasta la superficie. De acuerdo con la 
ecuación (P24.23.1), la presión se incrementa en forma lineal con 
la profundidad, como se ilustra en la figura P24.23a. Si se omite la 
presión atmosférica (porque opera contra ambos lados de la cara 
de la presa y en esencia se cancela), la fuerza total f, se determina con 
la multiplicación de la presión por el área de la cara de la presa (como 
se muestra en la figura P24.23b). Como tanto la presión como el área 
varían con la elevación, la fuerza total se obtiene con la evaluación 
de: 


£=| ogutD—0 dz 


donde w(z) = ancho de la cara de la presa (m) en la elevación z (véa- 
se la figura P24.23b). La línea de acción también puede obtenerse 
con la evaluación de: 


Josaatoo-a de 
d= 0 


[osuao-a 


Use la regla de Simpson para calcular f, y d. Compruebe los resultados 
con su programa de cómputo para la regla del trapecio. 

24.24 Para estimar el tamaño de una presa nueva, usted tiene que 
determinar el volumen total de agua (m?) que fluye por un río en un 
año. Usted dispone de los datos históricos promedio para el río: 


Med Med Med Med Med Med Med Med Med 
Ene Feb Mar Abr Jun Sep Oct Nov Dic 


30 38 82 125 95 20 22 24 35 


Fecha 


Flujo, m?/s 


Determine el volumen. Tenga cuidado con las unidades y al hacer una 
estimación apropiada del flujo en los puntos extremos. 

24.25 Los datos que se enlistan en la tabla siguiente proporcionan 
mediciones por hora del flujo de calor q (cal/cm?/h) en la superficie 
de un colector solar. Como ingeniero arquitecto, usted debe estimar 


Tabla P24.21 Tasa de flujo de tráfico (autos/min) en una intersección medida en diferentes 


momentos durante un periodo de 24 horas. 


Hora Tasa Hora Tasa 
12:00 medianoche 2 9:00 a.m. 11 
2:00 a.m. Z 10:30 a.m. 4 
4:00 a.m. 0 11:30 a.m. 11 
5:00 a.m. Z 12:30 p.m 12 
6:00 a.m. 6 2:00 p.m. 8 
7:00 a.m. 7 4:00 p.m. 7 
8:00 a.m. 23 5:00 p.m 26 


Hora Tasa 
6:00 p.m. 20 
7:00 p.m. 10 
8:00 p.m. 8 
9:00 p.m. 10 
10:00 p.m. 8 
11:00 p.m. 7 
12:00 medianoche 3 


Figura P24.23 

Presión que ejerce el agua sobre 
el parámetro de una presa: 

a) vista lateral que muestra el in- 
cremento lineal de la fuerza con 
la profundidad; b) vista frontal 
donde se muestra el ancho de la 
presa en metros. 
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el calor total absorbido por un panel colector de 150000 cm? duran- 
te un periodo de 14 horas. El panel tiene una eficiencia de absorción 
€. de 45%. El calor total absorbido está dado por: 


h=e,f, qAdt 


donde A es el área y q el flujo de calor. 


t | 0 2 4 6 8 10 12 14 


q | 0.10 5.32 7.80 8.00 8.03 6.27 3.54 0.20 


24.26 El flujo de calor q es la cantidad de calor que fluye a través 
de una unidad de área de cierto material por unidad de tiempo. Se 
calcula con la ley de Fourier: 


pa peE 
dx 


donde J está en unidades de J/m?/s o W/m?, y k es un coeficiente de la 
conductividad térmica que parametriza las propiedades conductoras 
de calor del material y se expresa en unidades de W/(*C - m). T = 
temperatura (*C); y x = distancia (m) a lo largo de la trayectoria del 
flujo de calor. La ley de Fourier la emplean en forma rutinaria los in- 
genieros arquitectos para determinar el flujo de calor a través de las 
paredes. Se midieron las temperaturas siguientes a partir de la super- 
ficie (x« = 0) de una pared de piedra: 


Xx, m | 0 0.08 


FSE | 20 17 15 


Si el flujo en x= 0 es de 60 W/n?, calcule el valor de k. 
24.27 El área de la superficie horizontal A, (m?) de un lago, a cierta 
profundidad, se calcula a partir del volumen por medio de diferen- 
ciación: 
dV 
A(o)=-—(z 
ss ) 
donde V= volumen (m3) y z = profundidad (m), se mide a partir de 
la superficie en dirección del fondo. La concentración promedio de una 
sustancia que varía con la profundidad c (g/m?) se obtiene por inte- 
gración: 
z 
$, «DA (dd: 
A A 
f, Ae 


T= 


donde Z= profundidad total (m). Determine la concentración prome- 
dio con base en los datos siguientes: 


z,m 0 4 8 12 16 
V, 10% m3 9.8175 5.1051 1.9635 0.3927 0.0000 
Cc, 9/m? 10.2 8.5 7.4 5.2 4.1 


Ingeniería eléctrica 
24.28 Lleve a cabo el mismo cálculo que en la sección 24.3, pero 
para la corriente según las especificaciones siguientes: 
¡(4) = 5e12% sen 271 1 
(e) =0 


para0<t<T/2 
paraT/2<t<T 


donde T'= 1 s. Use la cuadratura de Gauss de cinco puntos para es- 
timar la integral. 
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24.29 Repita el problema 24.28, pero emplee la regla de Simpson 
1/3 de cinco segmentos. 
24.30 Vuelva a hacer el problema 24.28, pero use integración de 
Romberg con e, = 1%. 
24.31 La ley de Faraday caracteriza la caída de voltaje a través de 
un inductor, así: 
di 

V, =L Ji 
donde V, = caída del voltaje (V), L = inductancia (en henrios; 
1H=1V.- s/A), i = corriente (A) y 1 = tiempo (s). Determine la 
caída del voltaje como función del tiempo, con los datos siguientes 
para una inductancia de 4 H. 


t | 0 0.1 0.2 0.3 0.5 0.7 
¡ | 0 0.16 0.32 0.56 0.84 2.0 


24.32 Con base en la ley de Faraday (véase el problema 24.31), use 
los datos siguientes de voltaje para estimar la inductancia en henrios 
si se pasa durante 400 milisegundos una corriente de 2 A por el in- 
ductor. 


10 20 40 60 80 120 180 280 400 
18 29 44 49 46 35 26 15 7 


t, ms | 


0 
V, volts | 0 


24.33 Suponga que la corriente a través de una resistencia está des- 
crita por la función: 


¡i(t) =(60— 1)? +(60-—1) sen(V1) 
y que la resistencia es función de la corriente: 
R=101+ 2/2 


Calcule el voltaje promedio desde f = O hasta 60, con el uso de la 
regla de Simpson 1/3 de segmentos múltiples. 

24.34 Si inicialmente un capacitor no tiene carga, el voltaje a través 
de él como función del tiempo se calcula por medio de: 


V(t)= E S , (Ddt 


Si C= 107 faradios, use los datos de corriente que siguen para ela- 
borar una gráfica del voltaje versus el tiempo: 


t7S | 0 0.2 0.4 0.6 0.8 1 1.2 
¡, 107 A | 0.2 0.3683 0.3819 0.2282 0.0486 0.0082 0.1441 


Ingeniería mecánica/aeroespacial 
24.35 Realice el mismo cálculo que en la sección 24.4, pero use las 
siguientes ecuaciones: 


F(x) = 1.6x — 0.0451? 
0(x) = 0.8 + 0.125x — 0.0091? + 0.0002x3 


Use reglas trapezoidales de 4, 8 y 16 segmentos para calcular la in- 
tegral. 

24.36 Repita el problema 24.35, pero use a) la regla de Simpson 1/3, 
b) la integración de Romberg hasta e, = 0.5% y c) la cuadratura de 
Gauss. 

24.37 Calcule el trabajo como se describe en la sección 24.4, pero 
use las siguientes ecuaciones para F(x) y 0(x): 


F(x) = 1.6x — 0.0451? 


0(x) = — 0.000551*+ 0.0123? + 0.13x 


La fuerza está en newtons y el ángulo en radianes. Realice la inte- 
gración desde x= 0 hasta 30 m. 

24.38 Como se hizo en la sección 24.4, determine el trabajo realiza- 
do si una fuerza constante de 1 N aplicada a un ángulo 0 resulta en 
los siguientes desplazamientos. Use la función de MATLAB 
cumtrapz para determinar el trabajo acumulativo y grafique el 
resultado contra 0. 


x, m | 0 1 2.7 3.8 3:7 3 1.4 
0, grados | 0 30 60 90 120 150 180 


24.39 El trabajo que realiza un objeto es igual a la fuerza por la 
distancia que se desplaza en la dirección de la fuerza. La velocidad 
de un objeto en la dirección de una fuerza está dada por 


0O=1=4 
4=<1f=<14 


v= 41 
v=16+ (4-1)? 


donde uv = m/s. Emplee la aplicación múltiple de la regla de Simpson 
para determinar el trabajo si se aplica una fuerza constante de 200 N 
para toda £. 

24.40 La tasa de enfriamiento de un cuerpo (figura P24.40) se ex- 
presa como: 


dT 

z k(T —T,) 
donde T = temperatura del cuerpo (*C), T,, = temperatura del medio 
circundante (*C) y k = constante de proporcionalidad (por minuto). 
Así, esta ecuación (denominada ley de Newton para el enfriamiento) 
especifica que la tasa de enfriamiento es proporcional a la diferencia 
de temperaturas del cuerpo y del medio circundante. Si una bola de 
metal calentada a 80%C se sumerge en agua que se mantiene a 7, = 
20”C constante, la temperatura de la bola cambia, así 


Tiempo, min | 0 5 10 15 20 25 


Tec 80 445 300 241 217 20.7 


Utilice diferenciación numérica para determinar d7/dt en cada valor 
del tiempo. Grafique dT/dt versus T — T,,, y emplee regresión lineal 
para evaluar k. 


Figura P24.40 


24.41 Una barra sujeta a una carga axial (véase la figura P24.41a) 
se deformará como se ilustra en la curva esfuerzo-tensión que apa- 
rece en la figura P24.41b. El área bajo la curva desde el esfuerzo cero 
hasta el punto de ruptura se denomina módulo de rigidez del material. 
Proporciona una medida de la energía por unidad de volumen que se 
requiere para hacer que el material se rompa. Por ello, es represen- 
tativo de la capacidad del material para superar una carga de impac- 
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to. Use integración numérica para calcular el módulo de rigidez para 
la curva esfuerzo-tensión que se aprecia en la figura P24.41b. 


Ruptura 


LIN 

60 
_ 4050 
2 

Módulo de 
20 rigidez 
0 0.1 0.2 e 
a) b) 


Figura P.24.41 

a) Barra sujeta a carga axial y b) la curva resultante esfuerzo- 
tensión, en la que el esfuerzo está en kips por pulgada cuadra- 
da (10* lb/pulg?), y la tensión es adimensional. 


24.42 Si se conoce la distribución de la velocidad de un fluido a 
través de un tubo (véase la figura P24.42), la tasa de flujo O (es decir, 
el volumen de agua que pasa por el tubo por unidad de tiempo) se 
calcula por medio de O = fvdA, donde v es la velocidad y A es el 
área de la sección transversal del tubo. (Para entender el significado 
físico de esta relación, recuerde la estrecha conexión que hay entre 
la suma y la integración.) Para un tubo circular, A = 01? y dA = 2xcr 
dr. Por lo tanto, 


O= de vQxrr) dr 


donde res la distancia radial medida hacia fuera del centro del tubo. 
Si la distribución de la velocidad está dada por 


1/6 
v -2J1-2) 
UN] 


donde r, es el radio total (en este caso, 3 cm), calcule O con el empleo 
de la regla del trapecio de aplicación múltiple. Analice los resultados. 


> 


Figura P24.42 


24.43 Con los datos siguientes, calcule el trabajo realizado por el esti- 
ramiento de un resorte con una constante de estiramiento de k=300 N/m 
ax=0.35 m. 


0.01 0.028 0.046 0.063 0.082 0.11 
0.05 0.10 0.15 0.20 0.25 0.30 


0.13 
0.35 


FE 10 | 
x, m | 


ojo 


540 


24.44 Se midió la posición de un avión de combate durante su ate- 
rrizaje en la cubierta de un portaviones: 


t,S | 0 0.52 1.04 1.75 2.37 3.25. 3.83 


| 153 185 208 249 261 271 273 


x, m 


donde x es la distancia desde el extremo del portaviones. Estime a) 
la velocidad (dx/dt) y b) la aceleración (dv/dt), por medio de diferen- 
ciación numérica. 
24.45 Emplee la regla de Simpson de aplicación múltiple para eva- 
luar la distancia vertical que recorre un cohete si su velocidad verti- 
cal está dada por: 


v=111?- 5t 0O=f=10 
v=1100 -— 51 10=1=20 
v= 501 + 2(+- 20) 20=1=30 


Además, use diferenciación numérica para desarrollar gráficas de la 
aceleración (dv/dt) y el arranque (4%v/d?) contra el tiempo, para 1 = 
0 a 30. Observe que el arranque es muy importante porque está alta- 
mente relacionado con lesiones como traumatismo cervical. 

24.46 La velocidad hacia arriba de un cohete se calcula con la fór- 
mula que sigue: 


v=u ln (Le 
mo, — qt 


donde uv = velocidad hacia arriba, u = velocidad a que se expele el 
combustible en relación con el cohete, m¿ = masa inicial del cohete 
en el tiempo 1 = 0, q = tasa de consumo de combustible y g = acele- 
ración de la gravedad en dirección hacia abajo (se supone constante 
= 9.8 m/s?). Si u= 1800 m/s, m, = 160000 kg y q = 2500 kg/s, uti- 
lice la regla del trapecio de seis segmentos y de Simpson 1/3, la 
cuadratura de Gauss de seis puntos y los métodos de Romberg O(h*) 
para determinar qué altura alcanzará el cohete en un vuelo de 30 s. 
Además, use diferenciación numérica para generar una gráfica de 
aceleración como función del tiempo. 

24.47 En relación con los datos del problema 20.61, encuentre la tasa 
de tensión por medio de métodos de diferencias finitas. Use aproxima- 
ciones de la derivada con exactitud de segundo orden y grafique sus 
resultados. Al ver la gráfica, es evidente que existe algún error expe- 
rimental de inicio. Encuentre la media y desviación estándar de la tasa 
de tensión después de eliminar los puntos de datos que representen el 
error experimental de arranque. 

24.48 Un flujo desarrollado por completo que pasa a través de un tubo 
de 40 cm de diámetro tiene el perfil de velocidad siguiente: 


Radio, r, cm 0.0 2.5 5.0 7.5 10.0 12.5 
0.914 0.890 0.847 0.795 0.719 0.543 


Velocidad, v, m/s 


15.0 
0.427 


175 20.0 
0.204 0 


Radio, r, cm 


Velocidad, v, m/s 


Encuentre la tasa de flujo volumétrico, O, con la relación O = ff 27erv 
dr, donde r es el eje radial del tubo, R es el radio del tubo, y ves la 
velocidad. Resuelva el problema con dos enfoques diferentes. 


a) Ajuste una curva polinomial alos datos de velocidad e intégrela 
en forma analítica. 

b) Para la integración utilice una aplicación múltiple de la regla de 
Simpson 1/3. 


Capítulo 24 Estudio de casos: integración y diferenciación numéricas 


c) Encuentre el error porcentual con el uso de la integral del ajuste 
polinomial como el valor más correcto. 


24.49 Un fluido desarrollado por completo de un plástico de Bingham 
que se mueve por un tubo de 12 pulg de diámetro, tiene el perfil de 
velocidades que sigue. El flujo de un fluido de Bingham no corta el 
núcleo central, lo que produce un flujo tapón alrededor de la línea 
central. 


Radio, r, pulg | 0 1 2 3 4 5 6 


Velocidad, v, pie/s | 5.00 5.00 4.62 4.01 342 1.69 0.00 


Encuentre la tasa de flujo volumétrico total, O, con el uso de la rela- 
ción Q = $7 271rv dr+v,A,, donde r es el eje radial del tubo, v es la 
velocidad, v, es la velocidad en el núcleo y A,.es el área de la sección 
transversal del tapón. Resuelva el problema con dos enfoques distin- 
tos. 


a) Ajuste una curva polinomial a los datos fuera del núcleo e inté- 
grela. 

b) Para la integración emplee la regla de Simpson de aplicaciones 
múltiples. 

c) Encuentre el error porcentual con el uso de la integral del ajuste 
polinomial como el valor más correcto. 


24.50 La entalpía de un gas real es función de la presión como se 
describe a continuación. Los datos se tomaron para un fluido real. 
Estime la entalpía del fluido a 400 K y 50 atm (evalúe la integral de 
0.1 atm a 50 atm). 


af, [ver (27) Jar 


v,L 
P, atm T=350 K T=400 K T=450 K 

0.1 220 250 282.5 

5 4.1 4.7 5.23 
10 2.2 25 2.7 
20 1.35 1.49 1:55 
25 alizd 1.2 1.24 
30 0.90 0.99 1.03 
40 0.68 0.75 0.78 
45 0.61 0.675 0.7 
50 0.54 0.6 0.62 


24.51 Dados los datos siguientes, encuentre el trabajo isotérmico 
realizado sobre el gas cuando se comprime de 23 La 3 L (recuerde 
que W =- SP dv). 


v,L 3 8 13 18 23 
12.5 3.9 1.8 1.4 1.2 


P, atm 


a) Encuentre en forma numérica el trabajo realizado sobre el gas, 
con la regla del trapecio de 1, 2 y 4 segmentos. 

b) Calcule las razones de los errores en estas estimaciones y re- 
laciónelas con el análisis del error de la regla del trapecio de 
multiplicación del capítulo 21. 

24.52 La ecuación de Rosin-Rammler-Bennet (RRB) se emplea para 

describir la distribución de los tamaños del polvo fino. F(x) repre- 

senta la masa acumulada de las partículas de polvo de diámetro x y 

más pequeñas. x' y n' son constantes iguales a 30 ¡um y 1.44, respec- 

tivamente. La distribución de la densidad de masa f(x) o masa de las 
partículas de polvo de un diámetro x, se encuentra con la derivada de 
la distribución acumulada. 


_dE(x) 


F()= ¡gen 
(x) ES 


Fa) 

a) Calcule en forma numérica la distribución de la densidad de 
masa f(x), y grafique tanto f(x) como la distribución acumulada 
F(x). 

b) Con sus resultados del inciso a), calcule la moda del tamaño de 
la distribución de la densidad de masa —es decir, el tamaño en 
que la derivada de Á(x) es igual a cero—. 

c) Encuentre el área superficial por masa de polvo S,, (cm?/g), por 


medio de: 
Sn T Sr AG) dx 
p dmín Xx 


La ecuación es válida sólo para partículas esféricas. Suponga una 
densidad p = 1 g cm” y un diámetro mínimo, d.;n, de polvo incluido 
en la distribución, de 1 um. 

24.53 Para el flujo de un fluido sobre una superficie, el flujo de 
calor hacia la superficie se calcula con: 


donde J = flujo de calor (W/m2), k = conductividad térmica (W/m - 
K), 7 = temperatura (K) y y = distancia normal a la superficie (m). 
Se hicieron las mediciones siguientes para el flujo de aire sobre una 
placa plana que mide 200 cm de largo y 50 cm de ancho: 


y cm | 0 1 3 5 
TK | 900 480 270 200 


Si k= 0.028 J/s - m - K, a) determine el flujo a la superficie, y b) la 
transferencia de calor en watts. Observe que 1 J=1W-s. 

24.54 El gradiente de presión para un flujo laminar a través de un 
tubo de radio constante, está dado por: 
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dp _ 840 


dx art 


donde p = presión (N/m2), x= distancia a lo largo de la línea central 
del tubo (m), uy = viscosidad dinámica (N - s/m?), O = flujo (m/s) y 
r= radio (m). 


a) Determine la caída de presión para un tubo de 10 cm de longitud 
para un líquido viscoso (1 = 0.005 N - s/m?, densidad =p =1 x 
103 kg/m) con un flujo de 10 x 10% m//s, y las variaciones del 
radio con la longitud que siguen, 


o 2 4 5 6 7 10 


| 2 1.35 1.34 1.6 1.58 1.42 2 

b) Compare su resultado con la caída de presión que tendría que 
ocurrir si el tubo tuviera un radio constante igual al radio pro- 
medio. 

c) Determine el número de Reynolds promedio para el tubo a fin 

de comprobar que el flujo es de verdad laminar (Re = pvD/u < 


2 100, donde v = velocidad). 


24.55 Se recabaron datos de la velocidad del aire en radios diferen- 
tes desde la línea central de un tubo circular de 16 cm de diámetro, 
como se muestra a continuación: 


r, cm Lo 160 3.20 480 6.40 7.47 7.87 7.95 8 


v, m/s [10 9.69 9.30 8.77 7.95 6.79 5.57 489 0 


Utilice integración numérica para determinar la tasa de flujo de masa, 
que se calcula como: 


S Ñ pv2xr dr 


donde p = densidad (= 1.2 kg/m). Exprese sus resultados en kg/s. 


EPÍLOGO: PARTE SEIS 


PT6.4 ALTERNATIVAS 


La tabla PT6.4 ofrece un resumen de las ventajas y las desventajas en la integración o cuadratura 
numérica. La mayoría de esos métodos se basa en la interpretación geométrica de considerar una 
integral como el área bajo una curva. Estas técnicas están diseñadas para evaluar la integral en dos 
casos diferentes: 1) una función matemática y 2) datos discretos en forma tabular. 

Las fórmulas de Newton-Cotes son los principales métodos analizados en el capítulo 21. Se 
aplican a funciones, continuas y discretas, existen versiones tanto cerradas como abiertas. Las fórmu- 
las abiertas tienen límites de integración que se extienden más allá del intervalo donde aparecen los 
datos, muy rara vez se utilizan para la evaluación de integrales definidas. Sin embargo, son de utilidad 
para la solución de ecuaciones diferenciales ordinarias y para la evaluación de integrales impropias. 

Las fórmulas cerradas de Newton-Cotes se basan en el reemplazo de una función matemática o 
de datos tabulados, por un polinomio de interpolación que es fácil de integrar. La versión más simple 
es la regla del trapecio, que se basa en el cálculo del área bajo una línea recta que une valores adyacen- 
tes de la función. Una manera para aumentar la exactitud de la regla del trapecio consiste en subdividir 
el intervalo de integración, desde a hasta b, en varios segmentos y aplicar el método a cada uno de ellos. 

Además de aplicar la regla del trapecio con una segmentación más fina, otra forma de obtener 
una estimación más exacta de la integral es usar polinomios de mayor grado que unan los puntos. Si 
se emplea una ecuación cuadrática, el resultado es la regla de Simpson 1/3; si se utiliza una ecuación 
cúbica, será la regla de Simpson 3/8. Como estas fórmulas son mucho más exactas que la regla del 
trapecio, por lo común tienen mayor preferencia, disponiéndose de versiones de aplicación múltiple. 
En situaciones con un número de segmentos par, se recomienda la aplicación múltiple de la regla de 
Simpson 1/3. Para un número de segmentos impar se puede aplicar la regla de Simpson 3/8 a los 
últimos tres segmentos, y la regla de Simpson 1/3 a los segmentos restantes. 

También existen fórmulas de Newton-Cotes de mayor grado. Sin embargo, en la práctica se usan 
muy rara vez. Cuando se requiere de alta exactitud, se dispone de las fórmulas de integración de 
Romberg y de la cuadratura de Gauss. Debe observarse que ambas tienen mayor valor práctico en 
los casos donde se dispone de la función. Dichas técnicas no son tan adecuadas para datos tabulados. 


PT6.5 RELACIONES Y FÓRMULAS IMPORTANTES 


La tabla PT6.5 resume la información importante que se expuso en la parte seis. Esta tabla se puede 
consultar para un acceso rápido de las relaciones y fórmulas importantes. 


Tabla PT6.4 Comparación de las características de los distintos métodos para la integración numérica. 
Las comparaciones se basan en la experiencia general y no toman en cuenta el comportamiento 
de funciones especiales. 


Puntos Puntos 

necesarios requeridos 

para una para n Error de Dificultad de 
Método aplicación aplicaciones truncamiento Aplicación programación Comentarios 
Regla del trapecio 2 n+1 =h?f"(E) Amplia Fáci 
Regla de Simpson 1/3 3 2n+1 =HRME) Amplia Fáci 
Regla de Simpson 
1/3 y 3/8 304 >3 = PRE) Amplia Fáci 
Newton-Cotes 
de mayor grado >5 N/D =P FNE) Rara Fáci 
Integración de Romberg 3 Requiere que Moderada No es tan apropiado 

se conozca f(x) para datos tabulares 

Cuadratura de Gauss >2 N/D Requiere que Fáci No es tan apropiado 


se conozca f(x) para datos tabulares 
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PT6.6 MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES 
Aunque revisamos varias de las técnicas de integración numérica, hay otros métodos que tienen utili- 
dad en la práctica de la ingeniería. Por ejemplo, los esquemas adaptativos para resolver ecuaciones 
diferenciales ordinarias, permiten evaluar integrales complicadas, como se analizará en el capítulo 25. 
Otro método para calcular integrales consiste en ajustar splines cúbicos a los datos. Las ecua- 
ciones cúbicas resultantes se integran de manera fácil (Forsythe y cols., 1977). Algunas veces se usa 
un procedimiento similar también en diferenciación. Por último, además de las fórmulas de Gauss- 
Legendre analizadas en la sección 22.3, existen otras fórmulas de cuadratura. Carnahan, Luther y 
Wilkes (1969), y Ralston y Rabinowitz (1978), resumen muchos de esos procedimientos. 
En síntesis, lo anterior tiene la intención de proporcionarle algunos caminos para una exploración 
más profunda de este tema. Además, todas las referencias anteriores describen las técnicas básicas 
tratadas en la parte seis. Le recomendamos consultar estas fuentes alternativas para ampliar su co- 
nocimiento de los métodos numéricos para la integración. 
Tabla PT6.5 Resumen de fórmulas importantes presentadas en la parte seis. 
Método Formulación Interpretación gráfica Error 
FO 4 
Regla del trapecio aibea) Fa) +F(b) _(b-ay (E) 
2 pas 
a b x 
FO 4 
Regla del trapecio not (b-aY 
de aplicación múltiple Fxy)+2 2,F0,)+F0,) 12n? 
I=(b-a) i=1 ' 
añ a=x b=x, * 
FO 4 
Regla de Simpson 1/3 Fx )+ 4F(x)+F 00) (b—aY 
I=(b o 1 2 _- (4) 
(ba) 2880 (5) 
a=xXo b=x, * 
FO 4 A 
Regla de Simpson 1/3 n-1 n-2 (b-aY sa) 
de aplicación múltiple Fx)+4 Y, Flx)+2 3, Foc )+F0c,) 180n* 
i=1,3 i=2,4 
1=(b-a) 
3n > 
a=x b=x, * 
Regla de Si 3/8 di $ 
egla de Simpson b=a 
¡= (0 ay 00)+340)+3F0) +00) A gang 
8 6 480 
a=xXo b=x, * 
Integración de Romberg E A big lia lp K O(h?%) 
paa 411 
lia, k-1 
Cuadratura de Gauss I=C Ax) o fx) + +c, Ax, ,) fu) =fn+ ME) 


*o X 


PARTE SIETE 


ECUACIONES DIFERENCIALES 
ORDINARIAS 


PT7.1 MOTIVACIÓN 


En el primer capítulo de este libro obtuvimos la siguiente ecuación basada en la segunda ley de 
Newton, para calcular la velocidad vu del paracaidista en caída como una función del tiempo + [re- 
cuerde la ecuación (1.9)]: 


AS (PT7.1) 
donde g es la constante gravitacional, m es la masa y c es el coeficiente de arrastre. Tales ecuaciones, 
que se componen de una función desconocida y de sus derivadas, se conocen como ecuaciones di- 
ferenciales. A la ecuación (PT7.1) algunas veces se le llama una ecuación de razón de cambio, ya 
que expresa la razón de cambio de una variable como una función de variables y parámetros. Estas 
ecuaciones desempeñan un papel importante en ingeniería debido a que muchos fenómenos físicos 
se formulan matemáticamente mejor en términos de su razón de cambio. 

En la ecuación (PT7.1), la cantidad que se está derivando, v, se conoce como variable dependien- 
te. La cantidad con respecto a la cual u se está derivando, f, se conoce como variable independiente. 
Cuando la función tiene una variable independiente, la ecuación se llama ecuación diferencial ordi- 
naria (o EDO). Esto contrasta con una ecuación diferencial parcial (o EDP) que involucra dos o más 
variables independientes. 

Las ecuaciones diferenciales se clasifican también en cuanto a su orden. Por ejemplo, la ecuación 
(PT7.1) se denomina como £DO de primer orden, ya que la derivada mayor es una primera derivada. 
Una EDO de segundo orden tiene una segunda derivada, como la mayor. Por ejemplo, la ecuación que 
describe la posición x de un sistema masa-resorte con amortiguamiento es la EDO de segundo orden, 


mo le =0 (PT7.2) 


donde c es un coeficiente de amortiguamiento y k es la constante del resorte. De manera similar, 
una ecuación de n-ésimo orden tiene una n-ésima derivada, como la mayor. 

Las ecuaciones de orden superior pueden reducirse a un sistema de ecuaciones de primer orden. 
Para la ecuación (PT7.2), esto se logra al definir una nueva variable y, donde 


_ dx (PT7.3) 

y nn ; 
que al derivar con respecto a £ se obtiene 

aid PT7.4 

dt de pi 
Las ecuaciones (PT7.3) y (PT7.4) se sustituyen después en la ecuación (PT7.2) para llegar a 

O (PT7.5) 

dt 

O 

dy cy +kx 

A (PT7.6) 


dt m 


546 


Figura PT7.1 
El péndulo oscilante. 


Parte 7 Ecuaciones diferenciales ordinarias 


Así, las ecuaciones (PT7.3) y (PT7.6) son un sistema de ecuaciones diferenciales de primer orden, 
equivalentes a la ecuación de segundo orden original. Como otras ecuaciones diferenciales de 
n-ésimo orden pueden reducirse en forma similar, esta parte de nuestro libro se concentra en la 
solución de ecuaciones diferenciales de primer orden. Algunas aplicaciones de la ingeniería en el 
capítulo 28 tratan con la solución de EDO de segundo orden por reducción a un sistema de dos 
ecuaciones diferenciales de primer orden. 


PT7.1.1 Métodos para resolver EDO sin el uso de la computadora 


Sin una computadora, las EDO podrían resolverse usando técnicas de integración analítica. Por 
ejemplo, la ecuación (PT7.1) se multiplica por dt y se integra para obtener 


v=f(s-£») dt (PT7.7) 
m 


El lado derecho de esta ecuación se conoce como integral indefinida debido a que no se especifican 
los límites de integración. Esto contrasta con las integrales definidas que se analizaron en la parte 
seis [compare la ecuación (PT7.7) con la ecuación (PT6.6)1. 

Una solución analítica para la ecuación (PT7.7) se obtiene si la integral indefinida puede eva- 
luarse en forma exacta como una ecuación. Por ejemplo, recuerde que para el problema del paracai- 
dista en caída, la ecuación (PT7.7) se resolvió analíticamente con la ecuación (1.10) (suponga que 
v=0en1t=0): 


_gm e Ac/m)t 
v(t) = Z (1 e Xi] (1.10) 


La mecánica para obtener tales soluciones analíticas se analizará en la sección PT7.2. Mientras 
tanto, lo relevante es que no están disponibles las soluciones exactas para muchas EDO de impor- 
tancia práctica. Como sucede en la mayoría de las situaciones analizadas en otras partes de este libro, 
los métodos numéricos ofrecen la única alternativa viable para tales casos. Como estos métodos 
numéricos por lo común requieren de computadoras, antes del auge de la informática los ingenieros 
se veían muy limitados en el alcance de sus investigaciones. 

Un método muy importante que los ingenieros y los matemáticos desarrollaron para superar 
este dilema fue la linealización. Una ecuación diferencial ordinaria lineal es aquella que tiene la 
forma general 


a, (y ++ +40) y +4, (0)y = f(x) (PT7.8) 


donde y” es la n-ésima derivada de y con respecto a x, y las a y fson funciones en términos de x. 
Esta ecuación se conoce como lineal debido a que no hay productos o funciones no lineales de la 
variable dependiente y y no existen productos de sus derivadas. La importancia práctica de las EDO 
lineales es que se resuelven analíticamente. En cambio, la mayoría de las ecuaciones no lineales no 
pueden resolverse de manera exacta. Así, en la era anterior a la computadora, una táctica para resol- 
ver ecuaciones no lineales era linealizarlas. 

Un ejemplo simple es la aplicación de las EDO para predecir el movimiento de un péndulo 
oscilante (figura PT7.1). De manera similar como se hizo en el desarrollo del problema del paracai- 
dista en caída, se utiliza la segunda ley de Newton para obtener la siguiente ecuación diferencial 
(véase la sección 28.4 para más detalles): 

2 

A +É senO=0 (PT7.9) 

dt l 
donde 0 es el ángulo de desplazamiento del péndulo, g es la constante gravitacional y l es la lon- 
gitud del péndulo. Esta ecuación no es lineal debido al término sen O. Una forma de obtener la 
solución analítica es darse cuenta de que para pequeños desplazamientos del péndulo a partir de 
su condición de equilibrio (es decir, para valores pequeños de 0), 


sen0=0 (PT7.10) 


Así, si suponemos que nos interesamos sólo en casos donde O es pequeño, la ecuación (PT7.10) 
se sustituye en la ecuación (PT7.9) para obtener 


PT7.2 Antecedentes matemáticos 


40, £e-0 (PT7.11) 


Tenemos, por lo tanto, transformada la ecuación (PT7.9) en una forma lineal que es fácil de resolver 
de manera analítica. 

Aunque la linealización es una herramienta muy valiosa para resolver problemas en ingeniería, 
existen casos donde no se puede utilizar. Por ejemplo, suponga que nos interesa estudiar el compor- 
tamiento del péndulo con grandes desplazamientos desde el equilibrio. En tales casos, los métodos 
numéricos ofrecen una opción viable para obtener la solución. En la actualidad, la disponibilidad 
tan amplia de las computadoras coloca esta opción al alcance de todos los ingenieros. 


PT7.1.2 Las EDO y la práctica en ingeniería 


Las leyes fundamentales de la física: la mecánica, la electricidad y la termodinámica con frecuencia 
se basan en observaciones empíricas que explican las variaciones de las propiedades físicas y los 
estados de los sistemas. Más que en describir directamente el estado de los sistemas físicos, las leyes 
a menudo se expresan en términos de los cambios del espacio y del tiempo. 

En la tabla PT7.1 se muestran algunos ejemplos. Esas leyes definen mecanismos de cambio. 
Cuando se combinan con las leyes de conservación de la energía, masa o momentum, resultan ecua- 
ciones diferenciales. La integración subsecuente de estas ecuaciones diferenciales origina funciones 
matemáticas que describen el estado espacial y temporal de un sistema en términos de variaciones 
de energía, masa o velocidad. 

El problema del paracaidista en caída que se presentó en el capítulo 1 es un ejemplo de la ob- 
tención de una ecuación diferencial ordinaria, a partir de una ley fundamental. Recuerde que se uti- 
lizó la segunda ley de Newton para desarrollar una EDO que describe la razón de cambio de la 
velocidad de un paracaidista en caída. Al integrar esta expresión, obtenemos una ecuación para pre- 
decir la velocidad de caída como una función del tiempo (figura PT7.2). Esta ecuación se utiliza de 
diferentes formas, entre ellas para propósitos de diseño. 

De hecho, tales relaciones matemáticas son la base para la solución de un gran número de pro- 
blemas de ingeniería. Sin embargo, como se describió en la sección anterior, muchas de las ecuaciones 
diferenciales de importancia práctica no se pueden resolver utilizando los métodos analíticos de 
cálculo. Así los métodos que se estudiarán en los siguientes capítulos resultan extremadamente im- 
portantes en todos los campos de la ingeniería. 


Tabla PT7.1 Ejemplos de las leyes fundamentales que se escriben en términos de la razón de 
cambio de variables (t = tiempo y x = posición). 


Ley Expresión matemática Variables y parámetros 
Segunda ley de Newton dv_F Velocidad (v), fuerza (F) y masa (m) 
del movimiento dt  m 
, ,aT ; e 
Ley del calor de Fourier q=k=— Flujo de calor (q), conductividad 
dx de ' 
dl térmica (k”) y temperatura (7) 
E 
Ley de difusión de Fick J=- e Flujo másico (1), coeficiente 
de difusión (D) y concentración (c) 
Ley de Faraday (caída de voltaje AV = dí Caída de voltaje (AV), 
a través de un inductor) LE =idt inductancia (L) y corriente (1) 


PT7.2 ANTECEDENTES MATEMÁTICOS 


La solución de una ecuación diferencial ordinaria es una función en términos de la variable inde- 
pendiente y de parámetros que satisfacen la ecuación diferencial original. Para ilustrar este concep- 
to, empecemos con una función dada 


y = 0.5x* + 4x7 — 1012 +8.5x+ 1 (PT7.12) 
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F= ma Ley física Figura PT7.2 
La secuencia de eventos en la aplicación de EDO para resolver 
problemas de ingeniería. El ejemplo mostrado es la velocidad de 
un paracaidista en caída. 


O EDO 


Analítica  Numérica 
la cual es un polinomio de cuarto grado (figura PT7,3a). Aho- 


ra, si derivamos con respecto de x a la ecuación (PT7.12), ob- 


y= (10m Yer = + (6 Evpar on tenemos una EDO: 
d 
q 2 +12x? -20x+8.5 (PT7.13) 
X 


Esta ecuación también describe el comportamiento del polinomio, pero de una manera diferente a 
la ecuación (PT7.12). Más que representar explícitamente los valores de y para cada valor de x, la 
ecuación (PT7.13) da la razón de cambio de y con respecto a x (es decir, la pendiente) para cada 
valor de x. La figura PT7.3 muestra tanto la función original como la derivada graficadas contra x. 
Observe cómo el valor cero en la derivada corresponde al punto en el cual la función original es 
plana; es decir, tiene una pendiente cero. Note también que los valores absolutos máximos de la 
derivada están en los extremos del intervalo donde las pendientes de la función son mayores. 
Como se acaba de mostrar, aunque es posible determinar una ecuación diferencial dando la 
función original, en esencia el objetivo es determinar la función original dada la ecuación diferencial. 
La función original representa la solución. En el presente caso, esta solución 
se determina de manera analítica al integrar la ecuación (PT7.13): 


2 y= | (or +12? 2048.35) de 


ale Aplicando la regla de integración (recuerde la tabla PT6.2) 


[E n+l 


furau= E +C n+-1 
n+1 


en cada término de la ecuación, se obtiene la solución 


>= Y 


y =-0.5x* +41? -10x? +8.5x+C (PT7.14) 


dy/dx la cual es idéntica a la función original con una notable excepción. En el 
proceso de la diferenciación y después en la integración, se pierde el valor 
constante de 1 en la ecuación original y ganamos el valor C. Esta Ces llama- 
da constante de integración. El hecho de que aparezca esta constante arbi- 
traria indica que la solución no es única. Es decir, es solución pero con un 
número infinito de funciones posibles (correspondiente al número infinito de 
> posibles valores de C) que satisfacen la ecuación diferencial. Por ejemplo, la 
figura PT7.4 muestra seis funciones posibles que satisfacen la ecuación 
(PT7.14). 

Por lo tanto, para especificar la solución por completo, la ecuación 
diferencial usualmente se encuentra acompañada por condiciones auxi- 
liares. Para las EDO de primer orden, se requiere un tipo de condición 
auxiliar, llamada valor inicial, para determinar la constante y obtener una 
solución única. Por ejemplo, la ecuación (PT7.13) se acompaña por la 


Figura PT7.3 condición inicial definida por x = 0, y = 1. Estos valores se sustituyen en 
Gráficas de a) y contra x, y b) dy/dx contra x para la ecuación (PT7.14): 


la función y =-0.514 + 4x7 — 104? + 8.51 +1. 


1=-0.5(0)* + 4(0)* -10(0? +8.5(0) + C (PT7.15) 


PT7.3 Orientación 549 


para determinar C = 1. Por consiguiente, la solución única que satisface 
tanto a la ecuación diferencial como la condición inicial especificada se 


A 
obtiene al sustituir C'= 1 en la ecuación (PT7.14): 
y =-0.5x* +4x* -10x?+8.5x+1 (PT7.16) 
De esta forma, hemos “fijado” la ecuación (PT7.14) al forzarla a pasar Esa 
a través de un punto dado por la condición inicial y, al hacerlo, encon- 
tramos una solución única para la EDO y completamos un ciclo con la 
función original [ecuación (PT7.12)]. Esf 

Las condiciones iniciales por lo común tienen interpretaciones muy 
tangibles para las ecuaciones diferenciales surgidas de las condiciones 
de problemas físicos. Por ejemplo, en el problema del paracaidista en 
caída, la condición inicial fue tomada del hecho físico de que en el C=-2 
tiempo cero la velocidad vertical es cero. Si el paracaidista hubiese es- y 
tado en movimiento vertical en el tiempo cero, la solución debería ha- 
berse modificado al tomar en cuenta esta velocidad inicial. Figura PT7.4 
Cuando tratamos con una ecuación diferencial de n-ésimo orden, se Seis posibles soluciones para la integral de -2x* + 

requiere de n condiciones para obtener una solución única. Si se especi- 12x”- 20x + 8.5. Cada una corresponde a un valor 
fican todas las condiciones en el mismo valor de la variable independien- — Jiferente de la constante de integración C. 
te (por ejemplo, en x o £= 0), entonces se conocen como problemas de 
valor inicial. En cambio en los problemas de valor en la frontera, la 
especificación de condiciones ocurre con diferentes valores de la variable 
independiente. En los capítulos 25 y 26 se analizarán problemas de valor inicial. Los problemas de 
valor en la frontera se estudiarán en el capítulo 27, junto con los problemas sobre valores propios. 


PT7.3 ORIENTACIÓN 


Antes de proceder con los métodos numéricos para la solución de ecuaciones diferenciales ordinarias, 
sería de utilidad tener alguna orientación. El siguiente material tiene como propósito ofrecerle una 
visión general del material que se estudiará en la parte siete. Además, formulamos objetivos para 
concentrar el análisis sobre el área de estudio. 


PT7.3.1 Alcance y presentación preliminar 


La figura PT7.5 ofrece un panorama general de la parte siete. Se analizarán en esta parte del libro 
dos categorías amplias de métodos numéricos, para problemas de valor inicial. Los métodos de un 
paso, los cuales se verán en el capítulo 25, permiten el cálculo y;,,, dada la ecuación diferencial y y,. 
Los métodos de pasos múltiples, que se estudiarán en el capítulo 26, requieren valores adicionales 
de y además de los de y,. 

Todos los métodos, excepto los métodos de un paso del capítulo 25, pertenecen a lo que se co- 
noce como técnicas de Runge-Kutta. Aunque el capítulo podría haberse organizado alrededor de esta 
noción teórica, optamos por un procedimiento intuitivo, más gráfico, para presentar los métodos. De 
esta manera, iniciamos el capítulo con el método de Euler, el cual tiene una interpretación gráfica 
muy directa. Luego se estudian dos versiones mejoradas al método de Euler, que están desarrollados 
a partir de argumentos visuales (las técnicas de Heun y las de punto medio). Después de esta intro- 
ducción, desarrollamos de manera formal el concepto de técnicas de Runge-Kutta (o RK) y mostramos 
cómo las técnicas anteriores constituyen el conjunto de métodos RK a partir de los de primero y se- 
gundo orden. Continuamos con las formulaciones de los métodos RK de orden superior que se utili- 
zan con mayor frecuencia en la solución de problemas de ingeniería. Además, cubrimos la aplicación 
de los métodos de un paso en los sistemas de EDO. Por último, el capítulo termina con un análisis de 
los métodos RK adaptativos que automáticamente ajustan el tamaño de paso en respuesta al error de 
truncamiento del cálculo. 

El capítulo 26 inicia con una descripción de las EDO rígidas, que se encuentran tanto en forma 
individual como en los sistemas de EDO, y para su solución ambos tienen componentes lentos y 
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Figura PT7.5 
Representación esquemática de la organización de la parte siete: Ecuaciones diferenciales ordinarias. 


rápidos. Presentamos la idea de una técnica de solución implícita como una de las soluciones más 
comunes para resolver este problema. 

Después, estudiamos los métodos de pasos múltiples. Estos algoritmos requieren información 
de los pasos anteriores para obtener una mayor efectividad en la trayectoria de la solución. También 
ofrecen una estimación del error de truncamiento que se puede utilizar para implementar un control 
en el tamaño de paso. En esta sección, seguimos primero un procedimiento intuitivo-visual al usar 
un método simple (el de Heun sin autoinicio), para presentar todas las características esenciales de 
los procedimientos de pasos múltiples. 

En el capítulo 27 abordamos los problemas de valores en la frontera y los problemas de valores 
propios (valores característicos o eigenvalores). Para los primeros, estudiamos tanto los métodos de 
disparo como los de diferencias finitas. Para los segundos, analizamos diferentes procedimientos, 
entre ellos, los métodos de polinomios y los métodos de potencias. Por último, el capítulo concluye 


PT7.3 Orientación 


con una descripción de la aplicación de varios paquetes de software y bibliotecas para la solución 
de las EDO y de los valores propios. 

El capítulo 28 se dedica a las aplicaciones en una gran gama de los campos de la ingeniería. 
Además, se incluye una sección con un breve repaso al final de la parte siete. Este epílogo resume y 
compara las fórmulas y los conceptos importantes relacionados con las EDO. La comparación in- 
cluye un análisis de las ventajas y las desventajas que son relevantes para su implementación en la 
práctica de la ingeniería. El epílogo también resume fórmulas importantes e incluye referencias 
sobre temas avanzados. 


PT7.3.2 Metas y objetivos 


Objetivos de estudio Después de completar la parte siete, usted debe aumentar de manera no- 
toria su capacidad para enfrentar y resolver tanto problemas de ecuaciones diferenciales ordinarias, 
como de valores propios. Las metas de estudio en general incluyen el manejo de las técnicas, y una 
capacidad para evaluar la confiabilidad de las respuestas; así como la posibilidad de seleccionar el 
“mejor” método (o métodos) para cualquier problema en particular. Además de estos objetivos ge- 
nerales, deberán dominar los objetivos de estudio específicos que se muestran en la tabla PT7.2. 


Objetivos de cómputo Se le ofrecen los algorítmos para muchos de los métodos en la parte 
siete. Esta información le permitirá aumentar su biblioteca de software. Por ejemplo, quizá le sea útil 
desde un punto de vista profesional tener el software que emplea el método de Runge-Kutta de cuar- 
to orden para más de cinco ecuaciones y resolver las EDO con un procedimiento adaptativo de ta- 
maño de paso. 

Por último, una de sus más importantes metas deberá ser el dominio de los diversos paquetes 
de software de propósito general que están disponibles. En particular, deberá convertirse en un en- 
tusiasta usuario de esas herramientas para implementar métodos numéricos en la solución de pro- 
blemas de ingeniería. 


Tabla PT7.2 Objetivos específicos de estudio de la parte siete. 
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1. Comprender las representaciones visuales de los métodos de Euler, de Heun y del punto medio. 


2. Conocer la relación del método de Euler con la expansión de la serie de Taylor y la implicación que esto tiene con respecto al error del método. 

3. Reconocer la diferencia entre los errores de truncamiento local y global, y cómo se relacionan con la selección de un método numérico para 
un problema específico. 

4. Entender el orden y la dependencia del tamaño de paso respecto de los errores de truncamiento global, para todos los métodos descritos 
en la parte siete; entender cómo dichos errores tienen que ver con la exactitud de las técnicas. 

5. Comprender la base de los métodos predictor-corrector; en particular, percatarse que la eficiencia del corrector es dependiente de la exacti- 
tud del predictor. 

6. Conocer la forma general de los métodos de Runge-Kutta; entender la deducción del método RK de segundo orden y cómo se relaciona 
con la expansión de la serie de Taylor; darse cuenta de que hay un número infinito de versiones posibles para los métodos RK de segundo 
orden y de orden superiores. 

7. Saber cómo aplicar cualquiera de los métodos RK a los sistemas de ecuaciones; poder reducir una EDO de n-ésimo orden a un sistema de 
n-EDO de primer orden. 

8. Reconocer el tipo de contexto de un problema donde es importante ajustar el tamaño de paso. 

9. Entender cómo se agrega el control del tamaño de paso adaptativo a un método RK de cuarto orden. 

10. Saber de qué modo la combinación de los componentes lentos y rápidos actúa en la solución de una ecuación o un sistema de ecuaciones rígidos. 

11. Distinguir entre esquemas de solución implícitos y explícitos para las EDO; en particular, reconocer cómo 1) se disminuye la rigidez del pro- 
blema y 2) se complica la mecánica de solución. 

12. Detectar la diferencia entre problemas de valor inicial y de valores en la frontera. 

13. Saber la diferencia entre los métodos de pasos múltiples y de un paso; darse cuenta de que todos los métodos de pasos múltiples son 
predictor-corrector, pero no a la inversa. 

14. Comprender la relación entre fórmulas de integración y métodos predictor-corrector. 

15. Reconocer la diferencia fundamental entre las fórmulas de integración de Newton-Cotes y la de Adams. 

16. Entender la fundamentación de los métodos de polinomios y de potencias para determinar los valores propios; en particular, reconocer sus 
ventajas y sus limitaciones. 

17. Saber cómo la deflación de Hoteller permite que el método de potencias se utilice para calcular los valores propios intermedios. 

18. Utilizar los paquetes de software y/o bibliotecas para integrar las EDO y evaluar los valores propios. 
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Métodos de Runge-Kutta 


Este capítulo se dedica a la solución de ecuaciones diferenciales ordinarias de la forma 


A ay) 


En el capítulo 1 se utilizó un método numérico para resolver una ecuación como la anterior, para el 
cálculo de la velocidad del paracaidista en caída. Recuerde que el método fue de la forma general 


Nuevo valor = valor anterior + pendiente x tamaño de paso 


o, en términos matemáticos, 


YA 
Yi+1 =) + Oh 
Pendiente = p 
| | 6 
X; Xi+ 1 Xx 
EÁáKA> A 
Tamaño de paso = h 
Figura 25.1 
Ilustración gráfica del método de un paso. 
YA 
Predicho 
Jorcor 
Verdadero 
=> 
Xi+ 1 X 


Yi+1= ¡+ Qh (25.1) 


De acuerdo con esta ecuación, la pendiente estimada se usa 
para extrapolar desde un valor anterior y, a un nuevo valor y, ; 
en una distancia h (figura 25.1). Esta fórmula se aplica paso a paso 
para calcular un valor posterior y, por lo tanto, para trazar la tra- 
yectoria de la solución. 

Todos los métodos de un paso que se expresen de esta forma 
general, tan sólo van a diferir en la manera en la que se estima la 
pendiente. Como en el problema del paracaidista en caída, el pro- 
cedimiento más simple consiste en usar la ecuación diferencial, 
para estimar la pendiente, en la forma de la primera derivada en 
X;- En otras palabras, se toma la pendiente al inicio del intervalo 
como una aproximación de la pendiente promedio sobre todo el 
intervalo. Tal procedimiento, llamado método de Euler, se anali- 
za en la primera parte de este capítulo. Después se revisan otros 
métodos de un paso que emplean otras formas de estimar la pen- 
diente que dan como resultado predicciones más exactas. Todas 
estas técnicas en general se conocen como métodos de Runge- 
Kutta. 


25.1 MÉTODO DE EULER 


La primera derivada ofrece una estimación directa de la pendien- 
te en x; (figura 25.2): 


P= f(x; y;) 


donde f(x;, y) es la ecuación diferencial evaluada en x; y y;. La 
estimación se sustituye en la ecuación (25.1): 


Yi = Yi + HO, y) (25.2) 


Figura 25.2 
Método de Euler. 


25.1 Método de Euler 


Esta fórmula se conoce como método de Euler (o de Euler-Cauchy o de punto pendiente). Se 
predice un nuevo valor de y usando la pendiente (igual a la primera derivada en el valor original de 
x) para extrapolar linealmente sobre el tamaño de paso h (figura 25.2). 


EJEMPLO 25.1 Método de Euler 
Planteamiento del problema Con el método de Euler integre numéricamente la ecuación (PT7.13): 


an 2x7 +12x?-20x+8.5 
dx 


desde x = 0 hasta x = 4 con un tamaño de paso 0.5. La condición inicial en x=0 es y = 1. Recuerde 
que la solución exacta está dada por la ecuación (PT7.16): 


y = 0.51% + da? — 101? + 8.5x + 1 


Solución Se utiliza la ecuación (25.2) para implementar el método de Euler: 
y(0.5) = y(0) + £(0, 1)0.5 

donde y(0) = 1 y la pendiente estimada en x=0 es: 
F(0, 1) =-2(0y + 12(0)? — 20(0) + 8.5 = 8.5 

Por lo tanto, 
y(0.5) = 1.0 + 8.5(0.5) = 5.25 

La solución verdadera en x = 0.5 es: 
y =-0.5(0.5)* + 4(0.5) — 10(0.5? + 8.5(0.5) + 1 =3.21875 

Así, el error es: 
E, = valor verdadero — valor aproximado = 3.21875 — 5.25 =--2,03125 

o, expresada como error relativo porcentual, e, = -63.1%. En el segundo paso, 
y(0) = y(0.5) + f(0.5, 5.25)0.5 


= 5.25 + [-2(0.5Y + 12(0.5) — 20(0.5) + 8.5]0.5 
= 5.875 


Tabla 25.1 Comparación de los valores verdadero y aproximado de la integral de y'= -2x* 
+ 121? — 20x + 8.5, con la condición inicial de que y = 1 en x= 0. Los valores 
aproximados se calcularon empleando el método de Euler con un tamaño de paso 
de 0.5. El error local se refiere al error en que se incurre sobre un solo paso. Éste 
se calcula con una expansión de la serie de Taylor como en el ejemplo 25.2. El 
error global es la discrepancia total debida a los pasos anteriores y presentes. 


Error relativo porcentual 


x Y verdadero Y Euler Global Local 
0.0 1.00000 1.00000 

0.5 3.21875 5.25000 -63.1 63.1 
1.0 3.00000 5.87500 -95.8 -28.1 
1 2.21875 5.12500 131.0 1.4 
2.0 2.00000 4.50000 125.0 20.3 
2.5 2.71875 4.75000 74.7 17.2 
3.0 4.00000 5.87500 46.9 3.9 
3.5 4.71875 7.12500 -51.0 -11.3 


4.0 3.00000 7.00000 133.3 53.1 
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Solución verdadera 


Capítulo 25 Métodos de Runge-Kutta 


Figura 25.3 

Comparación de la solución verdadera con una solución numérica 
usando el método de Euler, para la integral de y” =-2x* + 12x? — 
20x + 8.5 desde x = O hasta x = 4 con un tamaño de paso de 0.5. 
La condición inicial en x=0 es y= 1. 


La solución verdadera en x = 1.0 es 3.0 y, entonces, el error rela- 
tivo porcentual es -95.8%. El cálculo se repite y los resultados se 
dan en la tabla 25.1 y en la figura 25.3. Observe que aunque el 
cálculo capta la tendencia general de la solución verdadera, el error 


> resulta considerable. Como se explica en la siguiente sección, es 
posible reducir tal error usando un tamaño de paso menor. 


El ejemplo anterior usa un polinomio simple como ecuación diferencial con el objetivo de faci- 
litar el siguiente análisis de error. De esta forma, 
d. 


co 
de FO) 


En efecto, un caso más general (y más común) implica EDO, donde aparece una función que depen- 
de tanto de x como de y, 


dy 
2 =fx, 

q 0 

Conforme avancemos en esta parte del texto, nuestros ejemplos comprenderán EDO que dependen 
de variables independientes y dependientes. 


25.1.1 Análisis del error para el método de Euler 
La solución numérica de las EDO implica dos tipos de error (recuerde los capítulos 3 y 4): 


1. Errores de truncamiento, o de discretización, originados por la naturaleza de las técnicas em- 
pleadas para aproximar los valores de y. 

2. Errores de redondeo, causados por el número limitado de cifras significativas que una compu- 
tadora puede retener. 


Los errores de truncamiento se componen de dos partes. La primera es un error de truncamien- 
to local que resulta de una aplicación del método considerado, en un solo paso. La segunda es un 
error de truncamiento propagado que resulta de las aproximaciones producidas durante los pasos 
previos. La suma de los dos es el error de truncamiento global o total. 

Al adquirir cierta comprensión de la magnitud y de las propiedades del error de truncamiento, 
puede desarrollarse el método de Euler directamente de la expansión de la serie de Taylor. Para ello, 
observe que la ecuación diferencial que se va a integrar será de la forma general: 


y = $065) a 


donde y” = dy/dx, x y y son las variables independiente y dependiente, respectivamente. Si la solución 
(es decir, la función que describe el comportamiento de y) tiene derivadas continuas, se representa 
por una expansión de la serie de Taylor respecto a un valor inicial (x;, y;), como sigue [recuerde la 
ecuación (4.7)] 


25.1 Método de Euler 


y ye 
Yi SIAM lA AR, (25.4) 


donde h =x;,¡ —x; y R, = término remanente, definido como: 


pa A pr? 


= 25.5 
"(+1 200 


donde £ está en algún lugar en el intervalo de x, a x;, ¡. Es posible desarrollar una forma alternativa, 
sustituyendo la ecuación (25.3) en las ecuaciones (25.4) y (25.5) para obtener: 


4 (n-1) 
Yi A +0(H"*)) (25.6) 
! n! 


donde O(h" +") especifica que el error de truncamiento local es proporcional al tamaño de paso 
elevado a la potencia (n + 1). 

Al comparar las ecuaciones (25.2) y (25.6), se advierte que el método de Euler corresponde a la 
serie de Taylor, hasta el término f(x;, y;)h inclusive. Además, la comparación indica que el error de 
truncamiento se debe a que aproximamos la solución verdadera mediante un número finito de tér- 
minos de la serie de Taylor. Así, truncamos, o dejamos fuera, una parte de la solución verdadera. Por 
ejemplo, el error de truncamiento en el método de Euler se atribuye a los términos remanentes en la 
expansión de la serie de Taylor, que no se incluyeron en la ecuación (25.2). Al restar la ecuación 
(25.2), que es una aproximación de la (25.6) se llega a 


E 


e f + 0010) (25.7) 


t 


donde E, = error de truncamiento local verdadero. Para h suficientemente pequeña, los errores en 
los términos de la ecuación (25.7) normalmente disminuyen, en tanto aumenta el orden (recuerde el 
ejemplo 4.2 y el análisis que lo acompaña) y el resultado se representa como: 


E = PY) y 


a 21 (25.8) 


E, = 0(1?) (25.9) 


donde E, = error de truncamiento local aproximado. 


EJEMPLO 25.2 Estimación de la serie de Taylor para el error del método de Euler 


Planteamiento del problema Con la ecuación (25.7) estime el error en el primer paso del 
ejemplo 25.1. Úsela también para determinar el error debido a cada uno de los términos de orden 
superior en la expansión de la serie de Taylor. 


Solución Como tenemos un polinomio, se aplica la serie de Taylor para obtener estimaciones 
exactas del error en el método de Euler. La ecuación (25.7) se escribe como: 


, ” 6) 
E, pa f da y 4 F O q He F O (E25.2.1) 


donde f'(x;, y) = la primera derivada de la ecuación diferencial (que es la segunda derivada de la 
solución). En el presente caso, 


PF (e; y¡) =-6x? + 24x — 20 (E25.2.2) 


y f(x, y) es la segunda derivada de la EDO 
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Fi, y) =-12x + 24 (E25.2.3) 
y Fx, y;) es la tercera derivada de la EDO 
9, y) =-12 (E25.2.4) 


Podemos omitir términos adicionales (es decir, la cuarta derivada y las superiores) de la ecuación 
(E25.2.1), ya que en este caso específico son iguales a cero. Se debe observar que para otras funcio- 
nes (por ejemplo, funciones trascendentes como senoides o exponenciales) esto no necesariamente 
es cierto, y los términos de orden superior llegan a tener valores diferentes de cero. Sin embargo, en 
el caso presente, las ecuaciones (E25.2.1) a la (E25.2.4) definen por completo el error de truncamien- 
to en una sola aplicación del método de Euler. 

Por ejemplo, el error debido al truncamiento del término de segundo orden se calcula como sigue: 


_ —6(0.0)” +24(0.0)-20 


2 


Para el término de tercer orden: 
-12 +24 
E,, = A o =0.5 


y para el término de cuarto orden: 


-12 
—=(0.5)* =-0.03125 
24 


Se suman los tres resultados para obtener el error total de truncamiento: 


Els (0.5)? =-2.5 (E25.2.5) 


Ea = 


E,=E,, + E,3 + E,4=-2.5 + 0.5 — 0.03125 = 2.03125 


que es exactamente el error en que se incurrió en el paso inicial del ejemplo 25.1. Observe cómo 
E, 2 > E, 3 > E, 4, lo cual justifica la aproximación representada por la ecuación (25.8). 


Como se ilustra en el ejemplo 25.2, la serie de Taylor ofrece un medio de cuantificar el error en 
el método de Euler. Aunque existen limitaciones asociadas con su empleo para tal propósito: 


1. La serie de Taylor permite sólo una estimación del error de truncamiento local; es decir, el error 
generado durante un solo paso del método. No ofrece una medida del error propagado, por lo 
tanto, ni del error de truncamiento global. En la tabla 25.1 se incluyen los errores de trunca- 
miento local y global para el ejemplo 25.1. El error local se calculó en cada paso con la ecuación 
(25.2), pero usando el valor verdadero de y; (la segunda columna de la tabla) para calcular y; ¡ 
y no el valor aproximado (la tercera columna), como se hizo con el método de Euler. Como se 
esperaba, el error de truncamiento local absoluto promedio (25%) es menor que el error global 
promedio (90%). La única razón por la que es posible realizar estos cálculos de error exactos es 
que conocemos a priori el valor verdadero. Obviamente éste no será el caso en un problema real. 
En consecuencia, como lo analizaremos después, usted a menudo debe aplicar técnicas como el 
método de Euler, usando varios tamaños de paso, para obtener una estimación indirecta de los 
errores. 

2. Como se mencionó anteriormente, en problemas reales por lo común se tienen funciones más 
complicadas que simples polinomios. En consecuencia, las derivadas que se necesitan para 
obtener la expansión de la serie de Taylor no siempre serán fáciles de calcular. 


Aunque estas limitaciones impiden el análisis exacto del error en la mayoría de los problemas 
prácticos, la serie de Taylor brinda una valiosa ayuda en la comprensión en el comportamiento del 
método de Euler. De acuerdo con la ecuación (25.9), se advierte que el error local es proporcional al 
cuadrado del tamaño de paso y a la primera derivada de la ecuación diferencial. También se puede 
demostrar que el error de truncamiento global es O(h); es decir, es proporcional al tamaño de paso 
(Carnahan y colaboradores, 1969). Estas observaciones permiten establecer las siguientes conclusio- 
nes útiles: 


25.1 Método de Euler 


1. Se puede reducir el error disminuyendo el tamaño del paso. 

2. El método dará como resultado predicciones sin error si la función que se analiza (es decir, la 
solución de la ecuación diferencial) es lineal, debido a que en una línea recta la segunda derivada 
es Cero. 


Esta última conclusión tiene un sentido intuitivo, puesto que el método de Euler usa segmentos de 
línea recta para aproximar la solución. De ahí que al método de Euler se le conozca como un méto- 
do de primer orden. 

También deberá observarse que este patrón general rige a los métodos de orden superior de un 
paso, que se describen en las siguientes páginas. Es decir, un método de n-ésimo orden dará resulta- 
dos perfectos si la solución de la EDO es un polinomio de n-ésimo grado. Además, el error de trun- 
camiento local será O(h”*!); y el error global, O(»”.. 


EJEMPLO 25.3 Efecto de un tamaño de paso reducido en el método de Euler 


Planteamiento del problema Repita el cálculo del ejemplo 25.1, pero ahora use un tamaño de 
paso igual a 0.25. 


Solución Los cálculos se repiten, y los resultados se recopilan en la figura 25.4a). Al reducir el 
tamaño de paso a la mitad, el valor absoluto del error global promedio disminuye al 40%, y el valor 
absoluto del error local al 6.4%. Esto se compara con los errores global y local del ejemplo 25.1, 90 
y 24.8%, respectivamente. Así, como se esperaba, el error local 
disminuye a un cuarto y el error global a la mitad. 

Observe también cómo el error local cambia de signo en 
valores intermedios a lo largo del intervalo, lo cual se debe prin- YA 
cipalmente a que la primera derivada de la ecuación diferencial = 
es una parábola que cambia de signo [recuerde la ecuación 
(E25.2.2) y examine la figura 25.4b]. Debido a que el error local 
es proporcional a esta función, el efecto total de la oscilación en 
el signo es evitar un crecimiento continuo del error global con- 
forme se ejecuta el cálculo. Así, desde x = O hasta x = 1.25, todos A 
los errores locales son negativos y, en consecuencia, el error glo- 
bal aumenta en este intervalo. En la sección intermedia del inter- 
valo, los errores locales positivos comienzan a reducir el error 
global. Cerca del extremo, se invierte el proceso y, de nuevo, 
aumenta el error global. Si el error local continuamente cambia 
de signo sobre el intervalo de cálculo, normalmente el efecto 


Solución verdadera 
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total es reducir el error global. No obstante, si los errores locales 0 2 
son del mismo signo, entonces la solución numérica puede diver- a) 
ger cada vez más de la solución verdadera, en tanto se ejecuta el Ya 

cálculo. Se dice que tales resultados son inestables. 


x'Y 


Figura 25.4 

a) Comparación de dos soluciones numéricas con el método de 

Euler usando tamaños de paso 0.5 y 0.25. b) Comparación del eS 
error de truncamiento local verdadero y estimado donde el tama- 

ño de paso es 0.5. Observe que el error “estimado” se basa en la 

ecuación (E25.2.5). b) 


4 


Estimada 


Verdadera 
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Figura 25.5 


Efecto del tamaño de paso sobre el error de 
truncamiento global en el método de Euler 
para la integral de y” =-2x* + 12x?— 20x + 


8.5. La gráfica muestra el error global relativo 


porcentual absoluto en x= 5 en función del 


tamaño de paso. 


El efecto de algunas reducciones del tamaño de paso sobre el error de 
truncamiento global del método de Euler se ilustra en la figura 25.5, esta grá- 
fica muestra el error relativo porcentual absoluto en x= 5 en función del tama- 
ño de paso para el problema que se estudió en los ejemplos 25.1 a 25.3, 
Observe que aun cuando h se reduce a 0.001, el error todavía es mayor de 0.19%. 
Ya que este tamaño de paso corresponde a 5000 pasos para ir desde x = 0 has- 
tax=5, la gráfica sugiere que una técnica de primer orden, como el método de 
Euler, requiere de muchos cálculos para obtener niveles de error aceptables. Más 
adelante en este capítulo, se presentarán técnicas de orden superior que dan 
mucha mayor exactitud con el mismo trabajo de cálculo. Sin embargo, deberá 
observarse que, a pesar de su ineficiencia, la simplicidad del método de Euler 
lo hace una opción extremadamente atractiva para muchos problemas de inge- 
niería. Puesto que es muy fácil de programar, en particular la técnica es útil para 
llevar a cabo análisis rápidos. En la próxima sección se desarrolla un algoritmo 
computacional para el método de Euler. 


25.1.2 Algoritmo para el método de Euler 


Los algoritmos para las técnicas de un paso como el método de Euler son muy 
simples de programar. Como se especificó al inicio de este capítulo, todos los 
métodos de un paso tienen la forma general 


Nuevo valor = valor anterior + pendiente Xx tamaño de paso (25.10) 


En lo único que difieren los métodos es en el cálculo de la pendiente. 
Suponga que usted quiere realizar el cálculo simple expuesto en la tabla 
25.1. Es decir, a usted le gustaría utilizar el método de Euler para integrar y” 
=-2x7 + 121? — 20x + 8.5, con la condición inicial de que y = 1 en x=0. Usted 
quiere integrarla hasta x = 4 usando un tamaño de paso de 0.5, y desplegar 


todos los resultados. Un pseudocódigo simple para realizar esto será como el de la figura 25.6. 
Aunque este programa “hará el trabajo” de duplicar los resultados de la tabla 25.1 no está muy 
bien diseñado. Primero, y ante todo, no es muy modular. Aunque esto no es muy importante para un 
programa así de pequeño, podría resultar crítico si deseamos modificar y mejorar el algoritmo. 
Además, existen algunos detalles relacionados con la forma en que se establecen las iteraciones. 
Por ejemplo, suponga que el tamaño de paso se volviese muy pequeño para obtener mayor exactitud. 
En tales casos, debido a que se despliega cada valor calculado, la cantidad de valores de salida podría 


“intervalo de integración 


xi=0 
xf=4 
'variables iniciales 
x= XxÍ 
y=1 


"establece el tamaño de paso y determina el 


'número de pasos de cálculo 


dx = 0.5 
nc = (xf -= x1)/dx 


"condiciones de salida inicial 


PRINT Xx, y 


ser muy grande. Asimismo, el algoritmo supone que el intervalo 
de cálculo es divisible entre el tamaño de paso. Por último, la acu- 
mulación de x en la línea x = x + dx puede estar sujeta a la cuan- 
tificación de errores analizada en la sección 3.4.1. Por ejemplo, si 
dx se cambiara a 0.01 y se usara la representación estándar IEEE 
de punto flotante (cerca de siete cifras significativas), el resultado 
al final del cálculo sería 3.999997 en lugar de 4. Para dx = 0.001, 
¡sería 3.999892! 

En la figura 25.7 se muestra un algoritmo mucho más modu- 
lar que evita esas dificultades. El algoritmo no despliega todos los 
valores calculados. En lugar de eso, el usuario especifica un in- 
tervalo de salida, xout, que indica el intervalo en el cual los resul- 
tados calculados se guardan en arreglos, xP, Y YPm. Dichos 


"ciclo para implementar el método de Euler valores se guardan en arreglos, de tal modo que se puedan des- 
'y despliegue de resultados 


DOFOR 1 = 1, nc 


dydx = -2x? + 12x? - 20x + 8.5 
y = y + dydx + dx 


x= Xx + dx 
PRINT Xx, y 
END DO 


plegar de diferentes formas una vez que termine el cálculo (por 
ejemplo, impresos graficados, escritos en un archivo). 


Figura 25.6 
Pseudocódigo para una primera versión del método de Euler. 
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a) Programa principal o “manejador” b) Rutina para tomar un paso de salida 
Asigna valores para SUB Integrator (xXx, y, h, xend) 
y = valor inicial variable dependiente DO 
xi = valor inicial variable independiente IF (xend = x< h) THEN h = xend - Xx 
xf = valor final variable independiente CALL Euler (x, y, h, ynew) 
dx = cálculo del tamaño de paso y = ynew 
xout = intervalo de salida IF (x > xend) EXIT 
END DO 
x= xi END SUB 
m= 0 ) 
XPn = X c) Método de Euler para una EDO sola 
YPm = Y SUB Euler (Xx, y, h, ynew) 
DO CALL Derivs(x, y, dydx) 
xend = x + xout ynew = y + dydx * h 
IF (xend > xf) THEN xend = xf X= x+h 
h = dx END SUB 
CALL Integrator (x, y, h, xend) 
m=m>+ 1 d) Rutina para determinar la derivada 
pa So SUB Derivs (Xx, y, dydx) 
TF (x 2 xf) EXIT e 0 e 
END DO 
DISPLAY RESULTS 
END 
Figura 25.7 


Pseudocódigo para una versión modular “mejorada” del método de Euler. 


El programa principal toma grandes pasos de salida y llama a una rutina denominada Integrator 
que hace los pasos de cálculo más pequeños. Observe que los ciclos o loops que controlan tanto los 
pasos grandes como los pequeños terminan basándose en condiciones lógicas. Así, los intervalos no 
tienen que ser divisibles entre los tamaños de paso. 

La rutina Integrator llama después a la rutina Euler que realiza un solo paso con el método de 
Euler. La rutina Euler llama a una rutina Derivate que calcula el valor de la derivada. 

Aunque parecería que tal forma modular es demasiada para el presente caso, facilitará en gran 
medida la modificación del programa posteriormente. Por ejemplo, aunque el programa de la figura 
25.7 está diseñado específicamente para implementar el método de Euler, el módulo de Euler es la 
única parte que es específica para el método. Así, todo lo que se requiere para aplicar este algoritmo 
a otros métodos de un paso es modificar esta rutina. 


EJEMPLO 25.4 Solución de una EDO con la computadora 


Planteamiento del problema Es factible desarrollar un programa computacional a partir del 
pseudocódigo de la figura 25.7. Este software también sirve para resolver otro problema relacionado 
con la caída del paracaidista. Usted recordará de la parte uno que nuestro modelo matemático para 
la velocidad se basaba en la segunda ley de Newton, escrita en la forma: 


—=g-=y (E25.4.1) 


Esta ecuación diferencial se resolvió tanto de manera analítica (ejemplo 1.1) como numérica usando 
el método de Euler (ejemplo 1.2). Las soluciones fueron para el caso donde g = 9.81, c = 12.5, m = 
68.1 yv=0en1=0. 

El objetivo del presente ejemplo es repetir esos cálculos numéricos empleando un modelo más 
complicado para la velocidad con base en una descripción matemática más completa de la fuerza de 
arrastre causada por la resistencia del viento. Este modelo se obtiene como: 
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dv C 0) ) 
=8 v+a (E25.4.2) 
V 


máx 


donde g, m y c son las mismas que en la ecuación (E25.4.1), a, b y v,,s, son constantes empíricas, las 
cuales, en este caso, son iguales a 8.3, 2.2 y 46, respectivamente. Observe que con este modelo se 
puede ajustar con exactitud las mediciones empíricas de fuerzas de arrastre contra la velocidad, 
mejor que el modelo lineal simple del ejemplo 1.1. Sin embargo, 
esta flexibilidad mayor se gana a expensas de evaluar tres coefi- 
cientes en lugar de uno. Además, el modelo matemático resultan- 
te es más difícil de resolver en forma analítica. En este caso, el 
método de Euler ofrece una alternativa conveniente para obtener 
una solución numérica aproximada. 


No lineal Solución Los resultados para ambos modelos, lineal y no lineal, 
se muestran en la figura 25.8 con un tamaño de paso de integración 
de 0.1 s. La gráfica de la figura presenta también una coinciden- 
cia de la solución del modelo lineal con propósitos de comparación. 

Los resultados de las dos simulaciones indican cómo el au- 
mento en la complejidad de la formulación para la fuerza de 
arrastre afecta la velocidad del paracaidista. En este caso, la ve- 
locidad terminal disminuye debido a la resistencia causada por 
los términos de orden superior agregados en la ecuación (E25.4.2). 


ie e para la solución de la EDO no lineal En forma similar es posible utilizar modelos alternativos. La 
[ecuación (E25.4.2)]. Observe que la gráfica también mues- combinación de una solución generada con la computadora vuel- 
tra la solución para el modelo lineal [ecuación (E25.4.1)] ve esto una tarea fácil y eficiente. Tales beneficios le permitirán 
con propósitos de comparación. dedicar más tiempo a considerar alternativas creativas y aspectos 


holísticos del problema, en lugar de los tediosos cálculos a mano. 


25.1.3 Métodos para la serie de Taylor de orden superior 


Una manera de reducir el error con el método de Euler sería incluir términos de orden superior en 
la expansión de la serie de Taylor para la solución. Por ejemplo, al incluir el término de segundo 
orden en la ecuación (25.6) resulta: 


Pe ASIA (25.11) 


con un error de truncamiento aproximado de: 


Fx. y/) h? 
! 


E, = PY y 
6 
Aunque la incorporación de términos de orden superior es simple para implementarse en los 
polinomios, su inclusión no es tan trivial cuando la EDO es más complicada. En particular, las EDO 
que están en función tanto de la variable dependiente como de la independiente requieren de la de- 
rivación usando la regla de la cadena. Por ejemplo, la primera derivada de f(x, y) es: 


_of(x,y) E Of (x, y) dy 
Ox dy dx 


La segunda derivada es: 


FL) 


_ AOfÍOx +(0f/dy Xdyldx)] | Of Dx + (A/A NANA dy 
Ox dy dx 


Las derivadas de orden superior se van haciendo cada vez más complicadas. 


Py) 
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En consecuencia, como se describe en las próximas secciones, se han desarrollado métodos 
alternativos de un paso. Estos esquemas son comparables en eficiencia con los procedimientos de la 
serie de Taylor de orden superior, aunque requieren sólo del cálculo de las primeras derivadas. 


25.2 MEJORAS DEL MÉTODO DE EULER 


Un motivo fundamental de error en el método de Euler es suponer que la derivada al inicio del in- 
tervalo es la misma durante todo el intervalo. Hay dos modificaciones simples para evitar esta 
consideración. Como se demostrará en la sección 25.3, de hecho, ambas modificaciones pertenecen 
a una clase superior de técnicas de solución llamadas métodos de Runge-Kutta. Debido a que tienen 
una interpretación gráfica muy directa, los presentaremos antes de una deducción formal como los 
métodos de Runge-Kutta. 


25.2.1 Método de Heun 


Un método para mejorar la estimación de la pendiente emplea la 
determinación de dos derivadas en el intervalo (una en el punto 
inicial y otra en el final). Las dos derivadas se promedian después 
con la finalidad de obtener una mejor estimación de la pendiente 
en todo el intervalo. Este procedimiento, conocido como método 
de Heun, se presenta en forma gráfica en la figura 25.9. 

Recuerde que en el método de Euler, la pendiente al inicio de 
un intervalo 


y/= f(x; y;) (25.12) 


se utiliza para extrapolar linealmente a y, ¡: 


Mer = Y; + H(, y )h (25.13) A 


En el método estándar de Euler se debería parar aquí. Sin embar- 
go, en el método de Heun la y?, ¡ calculada en la ecuación (25.13) sal Pendiente = 14) +f0% +1 Yesa) 
no es la respuesta final, sino una predicción intermedia. Por con- 2 
siguiente, la distinguimos con un superíndice O. La ecuación 
(25.13) se llama ecuación predictora o simplemente predictor. Da 
una estimación de y;, , que permite el cálculo de una estimación 
de la pendiente al final del intervalo: 


Yi = His Y 1) (25.14) 


Yi 
Pendiente = f(x +1 +1) 


Pendiente = 
FO y) 


x Y 


x Y 


Así, se combinan las dos pendientes [ecuaciones (25.12) y (25.14)] 
para obtener una pendiente promedio en el intervalo: 


b) 


YA FEE rad) Figura 25.9 
= > SS > Representación gráfica del método de Heun. a) Predictor 
y b) corrector. 


> 


Esta pendiente promedio se utiliza después para extrapolar lineal- 
mente desde y, hasta y; , con el método de Euler: 


FIA ri , 
2 


Yi Ys 


que se conoce como ecuación correctora o simplemente corrector. 

El método de Heun es un procedimiento predictor-corrector. Todos los métodos de pasos múl- 
tiples que se analizarán más adelante en el capítulo 26 son de este tipo. El método de Heun es el 
único método predictor-corrector de un solo paso que se describe en este libro. Como se desarrolló 
antes, se expresa en forma concisa como: 
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Predictor (figura 25.94) — y? =y,+f(x, y,)h (25.15) 


de 


f 
Pu. 
5 


PY A adi) , (25.16) 


Corrector (figura 25.9b)  y,,,=y,+ 2 


Y, 


Observe que debido a que en la ecuación (25.16) aparece y, , ¡ a ambos 
lados del signo igual, entonces se puede aplicar en una forma iterativa. Es decir, 
una estimación anterior se utilizará de manera repetida para proporcionar una 
estimación mejorada de y, ¡. El proceso se ilustra en la figura 25.10. Deberá 
entenderse que este proceso iterativo no necesariamente converge a la respues- 
ta verdadera, sino que lo hará a una estimación con un error de truncamiento 
finito, como se mostrará en el siguiente ejemplo. 

Como en los métodos iterativos similares analizados en secciones anterio- 
res de este libro, un criterio de terminación para la convergencia del corrector 
está dado por [recuerde la ecuación (3.5)] 

Figura 25.10 Fo ja 

Representación gráfica de la forma iterativa = [441 +11 100% (25.17) 
del método corrector de Heun para obtener Yi 

una mejor estimación. 


donde y/,| y y/,, resultan de las iteraciones anterior y actual del corrector, 
respectivamente. 


EJEMPLO 25.5 Método de Heun 


Planteamiento del problema Con el método de Heun integre y” =4e08 — 0,5y desde x = 0 hasta 
x=4, con un tamaño de paso igual a 1. La condición inicial es en x=0, y =2. 


Solución Antes de resolver el problema numéricamente, se utiliza el cálculo para determinar la 
siguiente solución analítica: 


de i 
y= il 42 (E25.5.1) 


Tabla 25.2 Comparación de los valores verdadero y aproximado para la integral de y” = 4e08* — 
0.5y, con la condición inicial y = 2 en x= 0. Los valores aproximados se calcularon 
utilizando el método de Heun con un tamaño de paso igual a 1. Se muestran 
dos aplicaciones que corresponden a números diferentes de iteraciones del 


1 15 
x Y verdadero Y Heun |e(%) Y Heun le(%) 
0 2.0000000 2.0000000 0.00 2.0000000 0.00 
1 6.1946314 6.7010819 8.18 6.3608655 2.68 
2 14.8439219 16.3197819 9.94 15.3022367 3.09 
3 33.6771718 37.1992489 10.46 34.7432761 3.17 
4 75.3389626 83.3377674 10.62 77.7350962 3.18 


Esta fórmula sirve para generar los valores de la solución verdadera en la tabla 25.2. 
Primero, se calcula la pendiente en (<p, yy) como 


yo = 4e% - 0.5(2) =3 
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Este resultado difiere mucho de la pendiente promedio real en el intervalo de O a 1.0, que es igual a 
4.1946, como se calculó de la ecuación diferencial usando la ecuación (PT6.4). 

La solución numérica se obtiene al usar el predictor [ecuación (25.15)] para llegar a un estimado 
de y en 1.0: 


N=24+3(1)=5 


Observe que éste es el resultado obtenido con el método estándar de Euler. El valor verdadero en la 
tabla 25.2 muestra que corresponde a un error relativo porcentual del 19.3%. 

Ahora, para mejorar el estimado de y,, ¡, se emplea el valor y? para predecir la pendiente al final 
del intervalo: 


yí = fx, yO) = 48030 — 0,5(5) = 6.402164 


que se combina con la pendiente inicial para obtener una pendiente promedio en el intervalo desde 
x=0 hasta 1: 


!= 3+6.402164 =4.701082 


que está más cerca a la pendiente promedio verdadera, 4.1946. Dicho resultado se sustituye en el 
corrector [ecuación (25.16)] para obtener la predicción en x= 1: 


y, =2 + 4.701082(1) = 6.701082 


que representa un error relativo porcentual de -8.18%. Así, el método de Heun sin iteración del 
corrector reduce el valor absoluto del error en un factor de 2.4 en comparación con el método de 
Euler. 

Ahora dicho estimado se utiliza para mejorar o corregir la predicción de y, sustituyendo el 
nuevo resultado en el lado derecho de la ecuación (25.16): 


081) — 
deceso! [3 +4e EA CapIdE) episoia 


que representa un error relativo porcentual absoluto del 1.31%. El resultado, a su vez, se sustituye en 
la ecuación (25.16) para corregir aún más: 


1=6.382129 


o [3+ 4e9* -0.5(6.275811)] 
1 
2 


que representa un le | de 3.03%. Observe cómo los errores algunas veces crecen conforme se llevan 
a cabo las iteraciones. Tales incrementos pueden ocurrir especialmente con grandes tamaños de paso, 
y nos previenen de llegar a una conclusión general errónea de que siempre una iteración más mejo- 
rará el resultado. No obstante, con tamaños de paso lo suficientemente pequeños, las iteraciones, a 
la larga, deberán converger a un solo valor. En nuestro caso, 6.360865, que representa un error rela- 
tivo de 2.68%, que se obtiene después de 15 iteraciones. La tabla 25.2 presenta los resultados del 
resto de los cálculos usando el método con 1 y 15 iteraciones por paso. 


En el ejemplo anterior, la derivada es una función tanto de la variable dependiente y como de la 
variable independiente x. En situaciones como los polinomios, donde la EDO es únicamente función 
de la variable independiente, no se requiere el paso predictor [ecuación (25.16)] y el corrector se 
aplica sólo una vez en cada iteración. En tales casos, la técnica se expresa en forma concisa como 
sigue: 


YAA, 
2 


diri = Y + (25.18) 
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Observe la similitud entre el lado derecho de la ecuación (25.18) y la regla del trapecio [ecuación 
(21.3)]. La relación entre los dos métodos se puede demostrar formalmente empezando con la ecua- 


ción diferencial ordinaria: 


dy _ 
qx FO) 


De esta ecuación se obtiene y por integración: 


Lo dy= fo f(x) dx (25.19) 
cuyo resultado es: 

Vis TY = 7 FG) dx (25.20) 
o 

Y = yt)" Fx) dx (25.21) 
Ahora, del capítulo 21 recuerde que la regla del trapecio [ecuación (21.3)] se define como: 

jj" FW dx= SODA O) pus Ci), (25.22) 
donde h = x;, ¡ — Xx; Sustituyendo la ecuación (25.22) en la (25.21) se tiene: 

pj Ad (25.23) 


2 


que es equivalente a la ecuación (25.18). 
Como la ecuación (25.23) es una expresión directa de la regla del trapecio, el error de trunca- 
miento local está dado por [recuerde la ecuación (21.6)]: 


LO po 
12 


Método de Euler 


Método 
de Heun 


Solución verdadera 


Figura 25.11 

Comparación de la solución verdadera con la solución 
numérica usando los métodos de Euler y de Heun para la 
integral de y” =-2x? + 12x? — 20x + 8.5. 


(25.24) 


donde É está entre x, y x;, ¡ Así, el método es de segundo orden 
porque la segunda derivada de la EDO es cero mientras que la 
solución verdadera es una cuadrática. Además, los errores local y 
global son O(h*) y O(?), respectivamente. Entonces, al disminuir 
el tamaño de paso se disminuye el error más rápido que en el 
método de Euler. La figura 25.11, que muestra el resultado usan- 
do el método de Heun para resolver el polinomio del ejemplo 25.1, 
demuestra dicho comportamiento. 


25.2.2 Método del punto medio 
(o del polígono mejorado) 


La figura 25.12 ilustra otra modificación simple del método de 
Euler. Conocida como método del punto medio (o del polígono 
mejorado o el modificado de Euler), esta técnica usa el método 
de Euler para predecir un valor de y en el punto medio del inter- 
valo (figura 25.12a): 


h 
Yin = YE (25.25) 


Después, este valor predicho se utiliza para calcular una pendien- 
te en el punto medio: 


Yisim= Fis 112) Yis 1/2) (25.26) 


que se supone representa una aproximación válida de la pendien- 
te promedio en todo el intervalo. Dicha pendiente se usa después 
para extrapolar linealmente desde x;, hasta x;,, , (figura 25.12b): 


divi = Yi + HO 172 Yi+ 112)h (25.27) 


Observe que como y;,, no está en los dos lados, el corrector [ecua- 
ción (25.27)] no puede aplicarse de manera iterativa para mejorar 
la solución. 

Como en la sección anterior, este procedimiento también se 
relaciona con las fórmulas de integración de Newton-Cotes. Re- 
cuerde de la tabla 21.4 que la fórmula más simple de integración 
abierta de Newton-Cotes, la cual se denomina el método del 
punto medio, se puede representar como: 


b 
, F6) dx = (0 a) (1) 
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y 4 Pendiente =f(% , 1/2, Y + 1/2) 
x 
I 
I 
I 
I 
> 
Xx x 


donde x,, es el punto medio del intervalo (a, b). Usando la nomen- 
clatura del caso actual, lo anterior se expresa como: 


b) 


Je Fx) dx = Af (Xi 4112) 
Ñ Figura 25.12 


La sustitución de esta fórmula en la ecuación (25.21) dará la ecua- Representación gráfica del método del punto medio. a) Ecuación 


ción (25.27). De esta manera, así como al método de Heun se le (25-25) y b) ecuación (25.27). 


puede llamar la regla del trapecio, el método del punto medio 
obtiene su nombre de la fórmula de integración correspondiente 
sobre la cual se basa. 

El método del punto medio es mejor que el método de Euler debido a que utiliza una estimación 
de la pendiente en el punto medio del intervalo de predicción. Recuerde que, como vimos en la di- 
ferenciación numérica de la sección 4.1.3, las diferencias divididas finitas centradas son mejores 
aproximaciones de las derivadas, que las versiones hacia adelante o hacia atrás. Una aproximación 
centrada, como la de la ecuación (25.26) tiene un error de truncamiento local de O(4?) en comparación 
con la aproximación hacia adelante del método de Euler, que tiene un error de O(h). En consecuencia, 
los errores local y global del método del punto medio son O(»*) y O(h?), respectivamente. 


25.2.3 Algoritmos computacionales para los métodos 
de Heun y del punto medio 


Ambos métodos, el de Heun con un solo corrector y el del punto medio, se programan fácilmente 
con la estructura general mostrada en la figura 25.7. Como en las figuras 25.13a y 25.13b, es posible 
escribir rutinas simples en lugar de la rutina de Euler en la figura 25.7. 

No obstante, cuando se va a implementar la versión iterativa del método de Heun, las modifica- 
ciones son un poco más complicadas (aunque se localicen dentro de un solo módulo). Hemos desa- 
rrollado el pseudocódigo para este propósito en la figura 25.13c. Este algoritmo se combina con la 
figura 25.7 con el objetivo de desarrollar el software para el método iterativo de Heun. 


25.2.4 Resumen 


Al mejorar el método de Euler desarrollamos dos nuevas técnicas de segundo orden. Aun cuando esas 
versiones requieren más cálculos para determinar la pendiente, la reducción que se obtiene del error 
nos permitirá concluir, en una sección próxima (sección 25.3.4), que usualmente una mejor exactitud 
vale el esfuerzo. Aunque existen ciertos casos donde técnicas fácilmente programables, como el mé- 
todo de Euler, pueden aplicarse con ventaja, los métodos de Heun y del punto medio por lo común son 
superiores y se deberán implementar si son consistentes con los objetivos del problema. 
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Figura 25.13 
Pseudocódigo para 
implementar los métodos 
de a) Heun simple, 

b) punto medio y c) Heun 
iterativo. 
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a) Heun simple sin corrector c) Heun con corrector 

SUB Heun (Xx, y, h, ynew) SUB HeunIter (x, y, h, ynew) 
CALL Derivs (x, y, dyldx) es = 0.01 
ye = y + dyldx : h maxit = 20 
CALL Derivsíx + h, ye, dy2dx) CALL Derivs(x, y, dyldx) 
Slope = (dyldx + dy2dx)/2 ye = y + dyldx : h 
ynew= y + Slope :* h iter=0 
xX=x>w+h DO 

END SUB yeold = ye 


CALL Derivs(x + h, ye, dy2dx) 


b) Método del punto medio slope = (dyldx + dy2dx)/2 


SUB Midpoint (x, y, h, ynew) ye = y + slope * h 
CALL Derivs(x, y, dydx) ¡ter = ¡ter +1 
ym= y + dydx + h/2 das ye-yeold 100% 
CALL Derivs (x + h/2, ym, dymdx) ye 
ynew = y + dymdx + h IF (ea < es OR ¡ter > maxit) EXIT 
X= Xx>+h END DO 
END SUB era 
X= Xx 


END SUB 


Como se hace notar al inicio de esta sección, los métodos de Heun (sin iteraciones), del punto 
medio y, de hecho, la técnica de Euler misma son versiones de una clase más amplia de procedi- 
mientos de un paso denominada métodos de Runge-Kutta. Ahora veremos el desarrollo formal de 
esas técnicas. 


25.3 MÉTODOS DE RUNGE-KUTTA 


Los métodos de Runge-Kutta (RK) logran la exactitud del procedimiento de la serie de Taylor sin 
necesitar el cálculo de derivadas de orden superior. Existen muchas variantes, pero todas tienen la 
forma generalizada de la ecuación (25.1): 


Yi+1 = Yi + PO Ys Ah (25.28) 


donde p(x;, y;, h) se conoce como función incremento, la cual puede interpretarse como una pen- 
diente representativa en el intervalo. La función incremento se escribe en forma general como 


P=ajk +4k,+>>:+,Kk, (25.29) 


donde las a son constantes y las k son 


k¡ = FX; y;) (25.29a) 
Kk2= f(x, + pih, y¡+ qukiM) (25.29b) 
Kk3= f(x, + poh, y¡ + q21Kk1h + q2k2h) (25.29c) 
Ko = Fx; +Pn- ¡A, Y; + Qn- 11k¡h + q - 12Kk2h ++ qu Ln ¡Kn - ¡h) (25.29d) 


donde las p y las q son constantes. Observe que las k son relaciones de recurrencia. Es decir, k; 
aparece en la ecuación k,, la cual aparece en la ecuación kz, etc. Como cada k es una evaluación 
funcional, esta recurrencia vuelve eficientes a los métodos RK para cálculos en computadora. 

Es posible tener varios tipos de métodos de Runge-Kutta empleando diferentes números de 
términos en la función incremento especificada por n. Observe que el método de Runge-Kutta (RK) 
de primer orden con n = 1 es, de hecho, el método de Euler. Una vez que se elige n, se evalúan las 
a, p y q igualando la ecuación (25.28) a los términos en la expansión de la serie de Taylor (cuadro 
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25.1). Así, al menos para las versiones de orden inferior, el número de términos, n, por lo común 
representa el orden de la aproximación. Por ejemplo, en la siguiente sección, los métodos RK de 
segundo orden usan la función incremento con dos términos (n = 2). Esos métodos de segundo or- 
den serán exactos si la solución de la ecuación diferencial es cuadrática. Además, como los términos 
con h? y mayores se eliminan durante la deducción, el error de truncamiento local es O(A?) y el 
global es O(/?). En secciones subsecuentes desarrollaremos los métodos RK de tercer y cuarto ór- 
denes (n = 3 y 4, respectivamente). En tales casos, los errores de truncamiento global son O(4?) y 
O(h?), respectivamente. 


25.3.1 Métodos de Runge-Kutta de segundo orden 


La versión de segundo orden de la ecuación (25.28) es 


Yi+1 = ¡+ (ak, + azk,)h (25.30) 
donde: 

ki = Fx, y;) (25.30) 

k2¿= f(x, + pih, y¡+ qukih) (25.30b) 


Como se describe en el cuadro 25.1, los valores de a,, a», p, y q,, se evalúan al igualar la ecuación 
(25.30) con la expansión de la serie de Taylor hasta el término de segundo orden. Al hacerlo, 
desarrollamos tres ecuaciones para evaluar las cuatro constantes desconocidas. Las tres ecuacio- 
nes son: 


aj+a,=1 (25.31) 
1 

ad,p, = 2 (25.32) 
1 

42411 = 2 (25.33) 


Como tenemos tres ecuaciones con cuatro incógnitas, debemos dar el valor de una de estas incóg- 
nitas para determinar las otras tres. Suponga que damos un valor para a,. Entonces se resuelven de 
manera simultánea las ecuaciones (25.31) a (25.33) obteniendo: 


aj=1-a, (25.34) 


1 

P1=41= (25.35) 

2a, 

Debido a que podemos elegir un número infinito de valores para a,, hay un número infinito de 
métodos RK de segundo orden. Cada versión daría exactamente los mismos resultados si la solución 
de la EDO fuera cuadrática, lineal o una constante. Sin embargo, se obtienen diferentes resultados 
cuando (como típicamente es el caso) la solución es más complicada. A continuación presentamos 
tres de las versiones más comúnmente usadas y preferidas: 


Método de Heun con un solo corrector (a, = 1/2) Si suponemos que a, es 1/2 de las ecua- 
ciones (25.34) y (25.35) puede obtenerse a, = 1/2 y p, = q, = 1. Estos parámetros, al sustituirse en 
la ecuación (25.30), dan: 


1 1 
Y =9 +74 +34, )a (25.36) 


donde 


ki = FG, y;) (25.36a) 
k¿= Fx, +h, y, + kh) (25.36b) 
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La versión de segundo orden de la ecuación (25.28) es: 


Yi+1 = Y + (ak, + a2ko)h (C25.1.1) 
donde 

ki = f(X%, y) (C25.1.2) 
y 

k¿= f(x, + ph, Y, + qukih) (C25.1.3) 


Para usar la ecuación (C25.1.1) debemos determinar los valores 
de las constantes a, 4, p, y q11- Para ello, recordamos que la serie de 
Taylor de segundo orden para y, ¡, en términos de y, y f(x;, y;), se 
escribe como [ecuación (25.11)]: 


Yi+ ARAS 


donde f(x, y,) debe determinarse por derivación usando la regla de 
la cadena (sección 25.1.3): 


HAY, y) dy 
dx dy dx 


f EY ) hn? (C25.1.4) 


Fi y,) (C25.1.5) 


Si sustituimos la ecuación (C25.1.5) en la ecuación (C25.1.4) se 
obtiene: 


2 
LLE (C25.1.6) 


A =y + A 
Yis y; FO y;) (32 dy dx 2! 


La estrategia básica de los métodos de Runge-Kutta es el uso de 
manipulaciones algebraicas para obtener los valores de a;, a», p; y 
11, que hacen equivalentes a las ecuaciones (C25.1.1) y (C25.1.6). 

Para ello, primero usamos una serie de Taylor para expandir la 


ecuación (C25.1.3). La serie de Taylor para una función de dos va- 
riables se define como [recuerde la ecuación (4.26)]: 


A 
ox  0y 


Si se aplica este método para expandir la ecuación (C25.1.3) se llega 
a 


lo) 
Fx, + py hy, +9,k )= f(x, y,) + po 


0 a 
+9 O(H5) 


Este resultado se sustituye junto con la ecuación (C25.1.2) en la 
ecuación (C25.1.1) para obtener: 


of 
Ox 


lo) 
+09, MF 3)5 E +00) 


ir Y +ahf(x,,y)+a,hf(x,,y)+a,p h? 


o, agrupando términos, 


Yi = Y, +la, f(x, y) +4,f (%;, y,)]h 
ar ls ogr 
+ en e +49 /(X,,y,) aL +0(h”) (025.17) 


Ahora, si comparamos términos comunes en las ecuaciones (C25.1.6) 
y (C25.1.7), determinamos que para que las dos ecuaciones sean 
equivalentes, se debe satisfacer lo siguiente: 


a, +a,=1 
1 

a,P; 25 
1 

4,41; => 


Las tres ecuaciones simultáneas anteriores contienen las cuatro 
constantes desconocidas. Como hay una incógnita más que el núme- 
ro de ecuaciones, no existe un conjunto único de constantes que sa- 
tisfaga las ecuaciones. Sin embargo, considerando un valor para una 
de las constantes, es posible determinar el valor de las otras tres. En 
consecuencia, existe una familia de métodos de segundo orden y no 
una sola versión. 


Observe que k, es la pendiente al inicio del intervalo y que k, es la pendiente al final del intervalo. 
En consecuencia, este método de Runge-Kutta de segundo orden es, de hecho, la técnica de Heun 


sin iteración. 


El método del punto medio (a, = 1) Si suponemos que a, es 1, entonces a, =0, p, = q, = 1/2, 


y la ecuación (25.30) se convierte en: 


Yi+s1= Y + Koh 


donde 
ki = f(%;, y;) 


(25.37) 


(25.37a) 
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k, = da + > h, y, + - kn) (25.37b) 
2 2 
Éste es el método del punto medio. 
Método de Ralston (a, = 2/3) Ralston (1962) y Ralston y Rabinowitz (1978) determinaron que 


al seleccionar a, = 2/3 se obtiene un mínimo en el error de truncamiento para los algoritmos RK de 
segundo orden. Con esta versión, a, = 1/3 y p, = q, = 3/4 y da: 


Y =9+ 36424, ]n (25.38) 
donde 

ki = Fx, y;) (25.38a) 

k, = e + : h, y, + - bn) (25.38b) 


EJEMPLO 25.6 Comparación de varios esquemas RK de segundo orden 


Planteamiento del problema Utilice los métodos de punto medio [ecuación (25.37)] y el de 
Ralston [ecuación (25.38)] para integrar numéricamente la ecuación (PT7.13): 


Fx, y) = 2x7 + 12x? — 20x + 8.5 


desde x = 0 hasta x = 4, usando un tamaño de paso de 0.5. La condición inicial es x=0, y = 1. Com- 
pare los resultados con los valores obtenidos usando otro algoritmo RK de segundo orden: el méto- 
do de Heun sin iteración del corrector (tabla 25.3). 


Tabla 25.3 Comparación de los valores verdadero y aproximado de la integral de y*=-2x* 
+ 121? — 20x + 8.5, con la condición inicial de que y = 1 en x=0. Los valores 
aproximados se calcularon por medio de tres versiones de los métodos RK de 
segundo orden, con un tamaño de paso de 0.5. 


RK Ralston 
Heun Punto medio de segundo orden 
x Y verdadero y [e (%) y le(%) y le (%) 
0.0 1.00000 1.00000 0 1.00000 0 1.00000 0 
0.5 3.21875 3.43750 6.8 3.109375 3.4 3.277344 1.8 
1.0 3.00000 3.37500 12.5 2.81250 6.3 3.101563 3.4 
1.5 2.21875 2.68750 21.1 1.984375 10.6 2.347656 5.8 
2.0 2.00000 2.50000 25.0 As 12:5 2.140625 7.0 
2.5 2.71875 3.18750 17,2 2.484375 8.6 2.855469 5.0 
3.0 4.00000 4.37500 9.4 3.81250 4.7 4.117188 2.9 
39 4.71875 4.93750 4.6 4.609375 23 4.800781 JE 


4.0 3.00000 3.00000 0 3 0 3.031250 1.0 


Solución El primer paso en el método de punto medio consiste en usar la ecuación (25.37a) para 
calcular: 


k¡ =-2(0) + 12(0) — 20(0) + 8.5 = 8.5 


Sin embargo, como la EDO está en función sólo de x, este resultado carece de relevancia sobre el 
segundo paso [el uso de la ecuación (25.37b)] para calcular: 


k, =-2(0.25) + 12(0.25)? - 20(0.25) + 8.5 =4.21875 
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Figura 25.14 
E Alca Comparación de la solución verdadera con soluciones numéricas 
e-—4 Euler usando tres métodos RK de segundo orden y el método de Euler. 
|| EE Heun 
0-40 Punto medio 
AA Ralston 


Observe que tal estimación de la pendiente es mucho más cerca- 
na al valor promedio en el intervalo (4.4375), que la pendiente al 
inicio del intervalo (8.5) que se habría usado con el procedimien- 
to de Euler. La pendiente en el punto medio entonces se sustituye 
en la ecuación (25.37) para predecir: 


y(0.5) = 1 + 4.21875(0.5) = 3.109375 €, =3.4% 


El cálculo se repite; los resultados se resumen en la figura 25.14 
y en la tabla 25.3. 

0 2 4 5 En el método de Ralston, k, en el primer intervalo también 
es igual a 8.5 y [ecuación (25.38b)] 


k, =-2(0.375) + 12(0.375)? — 20(0.375) + 8.5 = 2.58203125 


La pendiente promedio se calcula mediante: 
Qf= 2685) + 2 2.58203125) = 4.5546875 
que se utiliza para predecir: 


y(0.5) = 1 + 4.5546875(0.5) = 3.27734375 e, =-1.82% 


Los cálculos se repiten; los resultados se resumen en la figura 25.14 y en la tabla 25.3. Observe que 
todos los métodos RK de segundo orden son superiores al método de Euler. 


25.3.2 Métodos de Runge-Kutta de tercer orden 


Para n = 3, es posible efectuar un desarrollo similar al del método de segundo orden. El resultado 
de tal desarrollo genera seis ecuaciones con ocho incógnitas. Por lo tanto, se deben dar a priori los 
valores de dos de las incógnitas con la finalidad de establecer los parámetros restantes. Una versión 
común que se obtiene es 


Y as 94 Ea +A + do) (25.39) 
donde 
k¡ = FX, y;) (25.394) 
1 1 
k, =f| x,+7h,y, +7 kh (25.39b) 
2 2 
k3= f(%, + h, y¡— k¡h + 2k2h) (25.390) 


Observe que si la EDO está en función sólo de x, este método de tercer orden se reduce a la 
regla de Simpson 1/3. Ralston (1962) y Ralston y Rabinowitz (1978) desarrollaron una versión alter- 
nativa que proporciona un mínimo para el error de truncamiento. En cualquier caso, los métodos RK 
de tercer orden tienen errores local y global de O(4*) y O(h3), respectivamente, y dan resultados 
exactos cuando la solución es una cúbica. Al tratarse de polinomios, la ecuación (25.39) será también 
exacta cuando la ecuación diferencial sea cúbica y la solución sea de cuarto grado. Ello se debe a 
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que la regla de Simpson 1/3 ofrece estimaciones exactas de la 


integral para cúbicas (recuerde el cuadro 21.3). dy 
25.3.3 Métodos de Runge-Kutta de cuarto orden 
El más popular de los métodos RK es el de cuarto orden. Como 
en el caso de los procedimientos de segundo orden, hay un núme- 
ro infinito de versiones. La siguiente, es la forma comúnmente 
usada y, por lo tanto, le llamamos método clásico RK de cuarto 
orden: 
1 
Sea o A +2k, +2k, + k,)h (25.40) 
Xx Xi+ 1/2 Xi+1 x 
donde 
k, = FG, y¡) (25.404) Figura 25.15 
Representación gráfica de las pendientes estimadas em- 
EE dx, m 1 hd 1 kn) (25.40b) pleadas en el método RK de cuarto orden. 
2 2 
1 1 
k,=f| x,+=h, y, +>k,h (25.40c) 
j 2, 2 
Kka= F(%,+h, y; + k3h) (25.40d) 


Observe que con las EDO que están en función sólo de x, el método RK clásico de cuarto orden 
es similar a la regla de Simpson 1/3. Además, el método RK de cuarto orden tiene similitud con el 
procedimiento de Heun en cuanto a que se usan múltiples estimaciones de la pendiente para obtener 
una mejor pendiente promedio en el intervalo. Como se muestra en la figura 25.15, cada una de las 
k representa una pendiente. La ecuación (25.40) entonces representa un promedio ponderado de 
éstas para establecer la mejor pendiente. 


EJEMPLO 25.7 Método clásico RK de cuarto orden 

Planteamiento del problema 

a) Con el método clásico RK de cuarto orden [ecuación (25.40)] integre 
Fx, y) = 2x7 + 121? — 20x + 8.5 


usando un tamaño de paso h = 0.5 y la condición inicial y =1 en x=0; 
b) De manera similar integre 


f(x, y) = 4e08* — 0.5Sy 
utilizando h = 0.5 con y(0) = 2 desde x = 0 hasta 0.5. 


Solución 
a) Se emplean las ecuaciones (25.40a) a (25.40d) para calcular k, = 8.5, k, =4.21875, k¿ =4.21875 
y k4= 1.25; las cuales se sustituyen en la ecuación (23.40) para dar 


y(0.5)=1+ (5165 +2(4.21875)+2(4.21875) +1 251) 0.5 


=3.21875 


que es exacta. Por consiguiente, como la solución verdadera es una cuártica [ecuación (PT7.16)], 
el método de cuarto orden da un resultado exacto. 


b) En este caso, la pendiente al inicio del intervalo se calcula como sigue: 
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k¡ = F(0, 2) = 4e080 — 0,5(2) =3 
Este valor se utiliza para calcular un valor de y y una pendiente en el punto medio, 


y(0.25) =2 + 3(0.25) =2.75 
k, = f(0.25, 2.75) = 4e080025 — 0.5(2,75) = 3.510611 


Esta pendiente, a su vez, se utiliza para calcular otro valor de y y otra pendiente en el punto 
medio, 


y(0.25) =2 + 3.510611(0.25) =2.877653 
kz = f(0.25, 2.877653) = 4e08025) _ 0.5(2.877653) = 3.446785 


Después, se usará esta pendiente para calcular un valor de y y una pendiente al final del inter- 
valo, 


y(0.5) = 2 + 3.071785(0.5) = 3.723392 
ka = F(0.5, 3.723392) = 4e0805 — 0,5(3.723392) = 4.105603 


Por último, las cuatro estimaciones de la pendiente se combinan para obtener una pendiente 
promedio, la cual se utiliza después para realizar la última predicción al final del intervalo. 


1 
Qf= Er + 2(3.510611)+2(3.446785) + 4.105603] = 3.503399 
y(0.5) =2+3.503399(0.5) =3.751669 


que es muy aproximada a la solución verdadera de 3.731521. 


25.3.4 Métodos de Runge-Kutta de orden superior 


Cuando se requieren resultados más exactos, se recomienda el método RK de quinto orden de Butcher 
(1964): 


1 

Y =9+ yy Ok, +32k +12k, 4324, +7k)h (25.41) 
donde 

ki = f(,, y;) (25.41a) 
0, E +40) (25.41b) 
2 e Y; an . 
a + kid) (25.41c) 
3 a y; ga ga y 

1 1 
k,=S| 3,4310), ¿tit ) (25.41d) 

3 3 9 
kz = -F—=h, y, +—k h+ —k,h (25.41e) 
sf x, 4 Y; 160 16 * ) 

3 2 12 12 8 

ko =S| 3, +0, ki + Shah + kh == kasa) (25.41/) 


Observe la semejanza entre el método de Butcher y la regla de Boole de la tabla 21.2. Existen las 
fórmulas RK de orden superior, como el método de Butcher, pero en general, la ganancia en exacti- 
tud con métodos mayores al cuarto orden se ve afectada por mayor trabajo computacional y mayor 
complejidad. 
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EJEMPLO 25.8 Comparación de los métodos de Runge-Kutta 


Planteamiento del problema Con los métodos RK desde primero has- 
ta quinto orden resuelva 


f(x, y) = 4e9% - 0.5Sy 


100 + 


con y(0) = 2 desde x = 0 hasta x = 4 con diferentes tamaños de paso. Compa- 
re la exactitud de los diferentes métodos para la estimación en x = 4, basán- 
dose en la respuesta exacta a cinco decimales, y(4) = 75.33896. 


Solución El cálculo se realiza usando los métodos de Euler, de Heun no 
iterativo, RK de tercer orden [ecuación (25.39)], clásico RK de cuarto orden 
y RK de quinto orden de Butcher. Los resultados se presentan en la figura 
25.16, donde graficamos el valor absoluto del error relativo porcentual contra 
el trabajo computacional. Esta última cantidad es equivalente al número re- 


Error relativo porcentual 
ES 
<= 
Nm 
| 


Euler 


Heun 


RK-3 


RK-4 


Butcher 
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Trabajo computacional 


el JE, 
querido de evaluaciones de la función para obtener el resultado, como: 19 
, ' b=a 
Trabajo computacional = 1, (E25.8.1) 
donde n;= número de evaluaciones de la función consideradas para el cálcu- 
lo particular de RK. Para órdenes < 4, n,es igual al orden del método; sin . 
embargo, observe que la técnica de Butcher de quinto orden requiere seis Figura 25.16 


evaluaciones de la función [ecuaciones (25.41a) a la (25.41f)]. La cantidad (b 
— ay/h es el intervalo de integración total dividido entre el tamaño de paso (es 
decir, es el número necesario de aplicaciones de la técnica RK para obtener 
el resultado. Como las evaluaciones de la función son generalmente las que 
consumen más tiempo, la ecuación (E25.8.1) proporciona una medida burda 
del tiempo de ejecución requerido para obtener la respuesta. 

La inspección de la figura 25.16 nos lleva a varias conclusiones: primero, que los métodos de 
orden superior logran mayor exactitud con el mismo trabajo computacional; segundo, que la ganan- 
cia en exactitud lograda por el mayor trabajo tiende a disminuir después de un punto. (Observe que 
las curvas primero caen con rapidez y después tienden a nivelarse.) 


órdenes. 


SUB RK4 (x, y, h, ynew) 
CALL Derivs(íx, y, k1) 
ym= y + kl - h/2 
CALL Derivsíx + h/2, ym, k2) 
ym= y + k2 +: h/2 
CALL Derivsíx + h/2, ym, k3) 
ye=y+k3:h 
CALL Derivsíx + h, ye, k4) 


slope (k1 + 2(k2 + k3) + k4)/6 Figura 25.17 
ynew= y + slope - h Pseudocódigo para determinar un solo paso del 
xX=x>w+*h método RK de cuarto orden. 

END SUB 


El ejemplo 25.8 y la figura 25.16 nos llevarán a la conclusión de que las técnicas RK de orden 
superior son siempre los métodos de preferencia. Sin embargo, deben considerarse otros factores 
cuando se elija una técnica de solución, como el costo de programación y los requerimientos de exac- 
titud del problema. Las alternativas (ventajas y desventajas) se explorarán con detalle en las aplica- 
ciones a la ingeniería en el capítulo 28 y en el epílogo de la parte siete. 


Comparación del error relativo porcentual 
contra trabajo computacional para los méto- 
dos de RK, desde el de primero hasta el quinto 
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25.3.5 Algoritmos computacionales para los métodos de Runge-Kutta 


Como en el caso de todos los métodos expuestos en este capítulo, las técnicas RK se ajustan muy bien 
al algoritmo general formulado en la figura 25.7. La figura 25.17 muestra el pseudocódigo para de- 
terminar la pendiente del método clásico RK de cuarto orden [ecuación (25.40)]. Las subrutinas que 
calculan las pendientes para todas las otras versiones se programan fácilmente de forma similar. 


25.4 SISTEMAS DE ECUACIONES 


Muchos problemas prácticos en la ingeniería y en la ciencia requieren la solución de un sistema de 
ecuaciones diferenciales ordinarias simultáneas más que de una sola ecuación. Tales sistemas en 
general se representan como: 


d 

A (Ys Var Y a) 

dx 

d 

2 Aa Y > Ya: Y) 

dx 

d 

Di f(x), Yo0.),) 05.42) 
dx 


La solución de este sistema requiere que se conozcan n condiciones iniciales en el valor inicial de x. 


25.4.1 Método de Euler 


Todos los métodos analizados en este capítulo, para ecuaciones solas, pueden extenderse al sistema 
que se mostró antes. Las aplicaciones en la ingeniería llegan a considerar miles de ecuaciones simul- 
táneas. En todo caso, el procedimiento para resolver un sistema de ecuaciones consiste únicamente 
en aplicar la técnica simple por ecuación en cada paso, antes de proceder con el siguiente. Lo ante- 
rior se ilustra mejor con el siguiente ejemplo para el método de Euler simple. 


EJEMPLO 25.9 Solución de sistemas de EDO usando el método de Euler 


Planteamiento del problema Resuelva el siguiente sistema de ecuaciones diferenciales utili- 
zando el método de Euler, suponiendo que en x=0, y, = 4 y y,= 6. Integre hasta x = 2 con un tama- 
ño de paso igual a 0.5. 


dy, 


dy 
= 0.5 =2 =4-0.3y, —0.1 
dx ds dx sd de 


Solución Se implementa el método de Euler para cada va- 


riable como en la ecuación (25.2): E 
x Y1 Ya 


y 1(0.5) = 4 + [-0.5(49]0.5 = 3 . A ; 
y2(0.5) = 6 + [4 — 0.3(6) — 0.1(4)]0.5 = 6.9 0.5 3 6.9 
7 1.0 2.25 LTS 
Observe que y¡(0) = 4 se emplea en la segunda ecuación en 5 1.6875 844525 
lugar de y,(0.5) = 3 calculada con la primera ecuación. Proce- 2.0 1.265625 9.094087 


diendo de manera similar se tiene: - 
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25.4.2 Métodos de Runge-Kutta 


Observe que cualquiera de los métodos RK de orden superior expuestos en este capítulo se pueden 
aplicar a los sistemas de ecuaciones. Sin embargo, debe tenerse cuidado al determinar las pendientes. 
La figura 25.15 es útil para visualizar la forma adecuada de hacer esto con el método de cuarto orden. 
Es decir, desarrollamos primero las pendientes para todas las variables en el valor inicial. Esas pen- 
dientes (un conjunto de las k,) se utilizarán después para realizar predicciones de la variable depen- 
diente en el punto medio del intervalo. Tales valores del punto medio se utilizan, a su vez, para 
calcular un conjunto de pendientes en el punto medio (las k,). Esas nuevas pendientes se vuelven a 
usar en el punto de inicio para efectuar otro conjunto de predicciones del punto medio que lleven 
a nuevas predicciones de la pendiente en el punto medio (las kz). Éstas después se emplearán para 
realizar predicciones al final del intervalo que se usarán para desarrollar pendientes al final del in- 
tervalo (las k4). Por último, las k se combinan en un conjunto de funciones incrementadas [como en 
la ecuación (25.40)] y se llevan de nuevo al inicio para hacer la predicción final. El siguiente ejemplo 
ilustra el procedimiento. 


EJEMPLO 25.10 Solución de sistemas de EDO usando el método RK de cuarto orden 


Planteamiento del problema Con el método RK de cuarto orden resuelva las EDO del ejem- 
plo 25.9. 


Solución Primero debemos encontrar todas las pendientes al inicio del intervalo: 
K1 1 = (0, 4, 6) = -0.5(4) = -2 
ki2= F0, 4, 6) = 4-0.3(6) — 0.1(4) = 1.8 
donde Ko es el ¡-ésimo valor de k para la ¡-ésima variable dependiente. Después, se requiere calcular 


los primeros valores de y, y y, en el punto medio: 


Y +K, ED =3.5 


ES N|> 


y. +. ==6+ 19 =6.45 


E 
que se utilizarán para calcular el primer conjunto de pendientes en el punto medio, 
Kk> 1 = f1(0.25, 3.5, 6.45) = 1.75 
Kk22= f2(0.25, 3.5, 6.45) = 1.715 


Estas sirven para determinar el segundo conjunto de predicciones en el punto medio, 


h 
Y + ko 7 = 44 (2175) a = 3.5625 


y, HK>) - =6+(1.715) = = 6.42875 


que se usan para calcular el segundo conjunto de pendientes en el punto medio, 


ka =F1(0.25, 3.5625, 6.42875) =-1.78125 
ka, = f2(0.25, 3.5625, 6.42875) = 1.715125 


Éstas se utilizarán para determinar las predicciones al final del intervalo: 


y + ka ¡h =4 + (21.78125)(0.5) = 3.109375 
y, + ka 2h =6 + (1.715125)(0.5) = 6.857563 


que se usan para calcular las pendientes al final del intervalo: 
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Ka 1 = F1(0.5, 3.109375, 6.857563) = —1.554688 
Ka2 = F2(0.5, 3.109375, 6.857563) = 1.631794 


Los valores de k se utilizan después para calcular [ecuación (25.40)]: 


y (0.5)=4+41 2+2(-1.75-1.78125)-1.554688]0.5 =3.115234 


1 
y,(0.5)=6+ Pd 2(1.715+1.715125)+1.631794]0.5 = 6.857670 


Procediendo de la misma forma con los pasos restantes se obtiene 


x Y1 Y2 


0 4 6 

0.5 3.115234 6.857670 
1.0 2.426171 7.632106 
ÉS 1.889523 8.326886 


2.0 1.471577 8.946865 


25.4.3 Algoritmo computacional para resolver sistemas de EDO 


El código computacional para resolver una sola EDO con el método de Euler (figura 25.7) puede 
fácilmente extenderse a sistemas de ecuaciones. Las modificaciones son: 


1. Dar el número de ecuaciones, n. 

2. Dar los valores iniciales para cada una de las n variables dependientes. 

3. Modificar el algoritmo de manera que calcule las pendientes para cada una de las variables 
dependientes. 

4. Incluir las ecuaciones adicionales para calcular los valores de la derivada por cada una de las 
EDO. 

5. Incluir ciclos para calcular un nuevo valor para cada variable dependiente. 


Este algoritmo se presenta en la figura 25.18 para el método RK de cuarto orden. Observe que 
es similar en estructura y organización a la figura 25.7. La mayoría de las diferencias se relacionan 
con el hecho de que: 


1. Hay n ecuaciones. 
2. Está el detalle adicionado del método RK de cuarto orden. 


EJEMPLO 25.11 Solución de sistemas de EDO con el uso de computadora 


Planteamiento del problema Un programa de cómputo para implementar el método RK de 
cuarto orden para sistemas se puede desarrollar fácilmente con base en las figuras 25.18. Tal software 
es conveniente para comparar diferentes modelos de un sistema físico. Por ejemplo, un modelo lineal 
para un péndulo oscilante está dado por [recuerde la ecuación (PT7.11)]: 


dy =y dy, _ 
dx ñ dx 


16.1y, 


donde y, y y, = desplazamiento angular y velocidad. Un modelo no lineal del mismo sistema es 
[recuerde la ecuación (PT7.9)]: 
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a) Programa principal o “manejador” b) Rutina para tomar un paso de salida 

Asigna valores para SUB Integrator (Xx, y, n, h, xend) 

n = número de ecuaciones DO 

y; = valores iniciales de n variables IF (xend - x< h) THEN h = xend - x 
dependientes CALL RK4 (x, y, n, h) 

X, = valor inicial de la variable IF (x > xend) EXIT 
independiente END DO 

xf = valor final de la variable END SUB 


independiente 
dx = cálculo del tamaño de paso 
xout = intervalo de salida 


c) Método RK de cuarto orden para un sistema 
de EDO 


SUB RK4(x, y, n, h) 


x= XI CALL Derivs (Xx, y, kl) 
m=0 DOFOR ¡= 1, n 
XP = X ym = y; + kl, * h12 
DOFOR ¡= 1, n END DO 
YPi.m = CALL Derivs (x+h/ 2, ym, k2) 
Yi = YT; DOFOR ¡= 1, n 
END DO ym = Yi + k2*h12 
DO END DO 
xend = x + xout CALL Derivs (x + h/ 2, ym, k3) 
IF (xend > xf) THEN xend = xf DOFOR i= 1, nm 
h = dx Yes = Yi + K3,*h 
CALL Integrator (x, y, n, h, xend) END DO 
m=m>+ 1 CALL Derivs (x + h, ye, k4) 
XPp = X DOFOR ¡= 1, n 
DOFOR 1= 1, n sTope; = (k1; + 2*(k2+k3;)+k4,)/6 
YPim= YI Y: = y, + slope; * h 
END DO END DO 
IF (x > xf) EXIT PE 
END DO END SUB 
DISPLAY RESULTS 
END d) Rutina para determinar derivadas 


SUB Derivs (Xx, y, dy) 
dy; E o 
do A 

END SUB 


Figura 25.18 
Pseudocódigo del método RK de cuarto orden para sistemas de ecuaciones. 


dy, dy, 
2= =-—16.1 sen 
de Ya de Q) 


donde y; y y4 = desplazamiento angular y velocidad en el caso no lineal. Resuelva estos sistemas 
en dos casos: a) un pequeño desplazamiento inicial (y, = y3=0.1 radianes; y, = y4= 0) y b) un gran 
desplazamiento (y, = yz = 73/4 = 0.785398 radianes; y, = y4 = 0). 


Solución 
a) Los resultados calculados para los modelos lineal y no lineal son casi idénticos (figura 25.19a). 
Esto era lo que se esperaba, ya que cuando el desplazamiento inicial es pequeño, sen (0) = 6. 
b) Cuando el desplazamiento inicial es 71/4=0.785398, las soluciones son diferentes. Esta diferencia 
se magnifica conforme el tiempo va aumentando (figura 25.19b). Esto se esperaba, ya que la 
suposición de que sen (0) = O es mala cuando theta es grande. 
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Soluciones obtenidas con un programa computacional para el método RK de cuarto orden. Las gráficas 
representan soluciones para péndulos tanto lineales como no lineales con desplazamientos iniciales a) 
pequeñas y b) grandes. 


25.5 MÉTODOS ADAPTATIVOS DE RUNGE-KUTTA 


Hasta ahora, se han presentado métodos para resolver las EDO que emplean un tamaño de paso 
constante. En un número significativo de problemas, esto llega a representar una seria limitación. 
Por ejemplo, suponga que pretendemos integrar una EDO con una solución del tipo expuesto en la 
figura 25.20. En la mayor parte del intervalo, la solución cambia de manera gradual. Tal comporta- 
miento sugiere la posibilidad de emplear un tamaño de paso grande para obtener resultados adecua- 
dos; sin embargo, en una región localizada desde x = 1.75 hasta x = 2.25, la solución tiene un cambio 
abrupto. La consecuencia práctica cuando se trabaja con estas funciones es que se requeriría un 
tamaño de paso muy pequeño para captar en forma más precisa el comportamiento impulsivo. Si se 
empleara un algoritmo con tamaño de paso constante, el tamaño de paso más pequeño necesario 
para la región del cambio abrupto se aplicaría en todo el cálculo. En consecuencia, un tamaño de 
paso más pequeño que el necesario (y, por lo tanto, la implicación de más cálcu- 
los) se desperdiciaría en las regiones del cambio gradual. 

Los algoritmos que ajustan automáticamente el tamaño de paso pueden 
evitar tal desperdicio y lograr así una gran ventaja. Como estos algoritmos se 
“adaptan” a la trayectoria de la solución, se dice que tienen control adaptativo 
del tamaño de paso. La implementación de tales procedimientos requiere la 
obtención de un estimado del error de truncamiento local en cada paso. Dicho 
error estimado puede servir después como base para aumentar o disminuir el 
tamaño de paso. 

Antes de proceder al desarrollo, debemos mencionar que además de resolver 
las EDO, los métodos descritos en este capítulo también se utilizan para evaluar 
integrales definidas. Como se menciona en la introducción de la parte seis, la 
evaluación de la integral: 


Figura 25.20 
A Ejemplo de la solución para una EDO que exhibe un cambio abrupto. El ajuste 


3 Xx automático del tamaño de paso tiene grandes ventajas en esos casos. 
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b 
fe J F0) dx 
es equivalente a resolver la ecuación diferencial: 
dy 
YE Fox 
di Fx) 


para y(b) dada la condición inicial y(a) = 0. Así, las siguientes técnicas se emplean para evaluar con 
eficiencia las integrales definidas de funciones que, en general, son suaves, pero que exhiben regio- 
nes de cambio abrupto. 

Existen dos procedimientos importantes para incorporar el control adaptativo del tamaño de 
paso en los métodos de un paso. En el primero, el error se estima como la diferencia entre dos pre- 
dicciones usando el método RK del mismo orden, aunque con diferentes tamaños de paso. En el 
segundo, el error de truncamiento local se estima como la diferencia entre dos predicciones usando 
métodos RK de diferente orden. 


25.5.1 Método adaptativo de RK o de mitad de paso 


El método de mitad de paso (o adaptativo de RK) consiste en realizar dos veces cada paso, una vez 
como un solo paso e, independientemente, como dos medios pasos. La diferencia entre los dos re- 
sultados representa un estimado del error de truncamiento local. Si y, representa la predicción con 
un solo paso, y y,, la predicción con dos medios pasos, el error Á se representa como: 


A=Y-)1 (25.43) 


Además de proporcionar un criterio para el control del tamaño de paso, la ecuación (25.43) también 
se utiliza para corregir la predicción y,. En la versión RK de cuarto orden, la corrección es: 


A 
a 25.44 
Ya — Y 15 ( ) 


Dicha estimación tiene una precisión de quinto orden. 


EJEMPLO 25.12 Método adaptativo de RK de cuarto orden 


Planteamiento del problema Utilice el método adaptativo de RK de cuarto orden para integrar 
y' =4e08x _ (.Sy desde x = 0 hasta 2 usando h = 2 y la condición inicial y (0) = 2. Ésta es la misma 
ecuación diferencial que se resolvió antes en el ejemplo 25.5. Recuerde que la solución verdadera es 
y(Q) = 14.84392, 


Solución La predicción sencilla con un tamaño de paso h se calcula como sigue: 


yQ)= 24 13+2(6.40216+4.70108)+14.1 1105]2=15.10584 


Las dos predicciones de medio paso son: 


1 
yO) =2+ Pa + 2(4.21730+3.91297)+5.945681]1 = 6.20104 


1 
yQ)=6.20104 + cia +2(8.72954 +7.99756)+12.71283]1 =14.86249 
Por lo tanto, el error aproximado es: 


E = 14.86249—15.10584 _ 
Ñ 15 
que está bastante cercano al error verdadero: 


E, = 14.84392 — 14.86249 = -0.01857 


0.01622 
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El error estimado se utiliza también para corregir la predicción 
yQ) = 14.86249 — 0.01622 = 14.84627 
la cual tiene un E, = -0.00235. 


25.5.2 Método de Runge-Kutta Fehlberg 


Además de dividir en dos el paso, como una estrategia para ajustar el tamaño de paso, un procedi- 
miento alternativo para obtener estimación del error consiste en calcular dos predicciones RK de 
diferente orden. Los resultados se restan después para obtener un estimado del error local de trun- 
camiento. Un defecto de tal procedimiento es el gran aumento en la cantidad de cálculos. Por ejem- 
plo, para una predicción de cuarto y quinto orden se necesita un total de 10 evaluaciones de la función 
por cada paso. El método de Runge-Kutta Fehlberg o RK encapsulado sagazmente evita este pro- 
blema al utilizar un método RK de quinto orden que emplea las evaluaciones de la función del mé- 
todo RK de cuarto orden correspondiente. Así, el procedimiento genera la estimación del error ¡con 
sólo seis evaluaciones de la función! 
En el presente caso, usamos la siguiente estimación de cuarto orden: 


a a a (25.45) 
E A E 
junto con la fórmula de quinto orden: 
a 2825 EA A e 217 ALTA n (25.46) 
27 648 43 384 55 296 14336 " 4 
donde 
k, = f(x, y) 
1 1 
k, =f| e EA 
3 3 9 
k, = Eh, y, +—k h+—k,h 
3= fx, 10 Y; 400 5) 
3 3 9 6 
k, = ¿+= hy, + kh k,h+=k,h 
AE A Shan) 
k¿=$f| x,+h, y, NE 0) 
ki=*f NN nO51 ip A. ¿A+ ÍA 7 
8 55296 512 13824 ” 110592 


Así, la EDO se resuelve con la ecuación (25.46) y el error estimado como la diferencia de las esti- 
maciones de quinto y cuarto órdenes. Debemos aclarar que los coeficientes usados antes fueron 
desarrollados por Cash y Karp (1990). Por esta razón se le llama el método RK Cash-Karp. 


EJEMPLO 25.13 Método de Runge-Kutta Fehlberg 


Planteamiento del problema Use la versión Cash-Karp del método de Runge-Kutta Fehlberg 
para realizar el mismo cálculo del ejemplo 25.12 desde x = O hasta 2 usando h = 2. 


25.5 Métodos adaptativos de Runge-Kutta 


Solución El cálculo de las k se resume en la siguiente tabla: 


x y f(x, y) 
k; 0 2 3 
k> 0.4 3.2 3.908511 
k3 0.6 4.20883 4.359883 
Ka 1.2 7.228398 6.832587 
ks 2 15.42765 12.09831 


K6 1.75 12.17686 10.13237 


Estas pueden usarse para calcular la predicción de cuarto orden: 


y =2 + sl 3+ zan 4.359883 + 125 e 832587 + 1013097 p =14.83192 


378 621 594 


junto con una fórmula de quinto orden: 


6.832587 


Mm 


E 2825 3+ 18 575 4359883 + 13525 
27648 — 48384 55 296 


227 
14 336 


+ 


12.09831+ 10, 127) = 14.83677 


El error estimado se obtiene al restar estas dos ecuaciones para dar: 


E, = 14.83677 — 14.83192 = 0.004842 


25.5.3 Control del tamaño de paso 


Ahora que hemos desarrollado formas para estimar el error de truncamiento local, se pueden usar 
para ajustar el tamaño de paso. En general, la estrategia es incrementar el tamaño de paso si el error 
es demasiado pequeño y disminuirlo si es muy grande. Press y cols. (1992) han sugerido el siguien- 
te criterio para lograr esto: 


104 


nuevo 


A 


h =h 


nuevo actual 


(25.47) 


actual 
donde actual Y Anuevo = tamaño de los pasos actual y nuevo, respectivamente, Aact, = exactitud actual 
calculada, Anuey, = exactitud deseada, y  = exponente constante que es igual a 0.2 cuando se incre- 
menta el tamaño de paso (por ejemplo, cuando Aactua, £ Anuevo) y A 0.25 cuando se disminuye el ta- 
maño de paso (Aacrar > Anuevo): 

El parámetro clave en la ecuación (25.47) es, obviamente, Anueyo ya que este valor permite espe- 
cificar la exactitud deseada. Una manera de lograrlo consistirá en relacionar A,uey, CON UN Nivel re- 
lativo de error. Como funciona bien sólo cuando se tienen valores positivos, llega a originar 
problemas para soluciones que pasan por cero. Por ejemplo, usted podría estar simulando una función 
oscilatoria que repetidamente pase por cero, pero que esté limitada por valores máximos absolutos. 
En tal caso, se desearía que estos valores máximos figuraran en la exactitud deseada. 

Una forma más general de trabajar con estos casos es determinar Anueyo COMO 


Ahnuevo = E Yescala 


donde e = nivel de tolerancia global. La elección de y.;c.¡, determinará, entonces, cómo se escala el 
error. Por ejemplo, Si Yesa, = y, la exactitud se dará en términos de errores relativos fraccionales. Si 
usted tiene un caso donde desee errores constantes relativos a un límite máximo preestablecido, haga 
Yescala Igual a ese límite. Un truco sugerido por Press y cols. (1992) para obtener errores relativos cons- 
tantes, excepto muy cerca de cero, es: 
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Vescala = bl Es 


ne 
dx 


Esta es la versión que usaremos en nuestro algoritmo. 


25.5.4 Algoritmo computacional 


Las figuras 25.21 y 25.22 muestran el pseudocódigo para implementar la versión Cash-Karp del 
algoritmo Runge-Kutta Fehlberg. Este algoritmo sigue el patrón dado en una implementación más 
detallada proporcionada por Press y cols. (1992) para sistemas de EDO. 

La figura 25.21 implementa un solo paso de la rutina de Cash-Karp (que son las ecuaciones 
25.45 y 25.46). La figura 25.22 muestra un programa principal general junto con una subrutina que 
adapta el tamaño de paso. 


EJEMPLO 25.14 Aplicación con computadora de un esquema adaptativo 
de RK de cuarto orden 


Planteamiento del problema El método adaptativo de RK es apropiado para la solución de la 
siguiente ecuación diferencial ordinaria 


d ] o) 2 
e +06 =100 RON (E25.14.1) 
X 


Observe que para la condición inicial, y(0) = 0.5, la solución general es: 
y = 0.5006: (E25.14.2) 


que es una curva suave que gradualmente se aproxima a cero conforme x aumenta. En cambio, la so- 
lución particular presenta una transición abrupta en la vecindad de x = 2 debido a la naturaleza de la 
función forzada (figura 25.23a). Use un esquema estándar RK de cuarto orden para resolver la ecuación 


SUBROUTINE RKkc (y,dy,x,h,yout,yerr) 

PARAMETER (a2=0.2,a3=0.3,a4=0.6,a5=1.,a6=0.875, 
b21=0.2,b31=3./40.,b32=9./40.,b41=0.3,b42=-0.9, 
b43=1.2,b51=-11,/54.,b52%=2.5,b53=-70./27. 
b54=35./27.,b61=1631./55296.,b62=175./512., 
b63=575./13824, ,b64=44275./110592.,b65=253./4096. 
cl1=37.1378.,c3=250./621.,c4=125./594., 
có6=512./1771.,dc1=c1-2825./27648., 
dc3=c3-18575./48384.,dc4=c4-13525./55296. 
dc5=-277.114336.,dc6=c6-0.25) 

ytemp=y+b21*h*dy 

CALL Derivs (x+a2*h, ytemp,k2) 

ytemp=y+h*(b31*dy+b32*k2) 

CALL Derivs(x+a3*h, ytemp,k3) 

ytemp=y+h*(D41*dy+b42*k2+b43*k3) 

CALL Derivs(x+a4*h, ytemp,k4) 

ytemp=y+h*(b51*dy+b52*k2+b53*k3+b54*k4) 

CALL Derivs(x+a5*h, ytemp,k5) 

ytemp=y+h*(D61*dy+b62*k2+b63*k3+D64*k4+bD65*k5) 


Figura 25.21 CALL Derivs(x+a6*h, ytemp,k6) 
Pseudocódigo para un solo yout=y+h*(c1*dy+c3*k3+c4*k4+c6*k6) 
paso del método RK yerr=h*(dcl*dy+dc3*k3+dc4*k4+dc5*k5+dc6o*k6) 


Cash-Karp. END RKkc 


a) Programa principal 


INPUT xi, xf, yl 

maxstep=100 

hi=.5; tiny = 1.x 10% 

eps=0.00005 

print *, xi,yi 

X=X1 

y=y¡ 

h=hi 

¡step=0 

DO 
IF (istep > maxstep AND x < xf) EXIT 
istep=istep+l 
CALL Derivs(x,y, dy) 
yscal=ABS(y)+ABS(h*dy)+tiny 
IF (x+MXxF) THEN h=xf=x 
CALL Adapt (x,y,dy,h,yscal,eps,hnxt) 
PRINT x,y 
h=hnxt 

END DO 

END 


Figura 25.23 

a) Una función forzada en forma de campana que 
induce un cambio abrupto en la solución de una 
EDO [ecuación (E25.14.1)]. b) La solución. Los pun- 
tos indican las predicciones para una rutina adapta- 
tiva paso-tamaño. 


(E25.14.1) desde x = O hasta 4. Después emplee el 
esquema adaptativo que se describe en esta sección 
para realizar el mismo cálculo. 


Solución Primero se utiliza el esquema clásico de 
cuarto orden para calcular la curva mostrada en la 
figura 25.23b. Para hacer este cálculo se usa un ta- 
maño de paso de 0.1, de manera que se efectúan 
4/(0.1) = 40 aplicaciones de la técnica. Después, se 
repite el cálculo con un tamaño de paso de 0.05 para 
un total de 80 aplicaciones. La principal discrepancia 
entre los dos resultados se presenta en la región que 
va de 1.8 a 2.0. La magnitud de la discrepancia será 
aproximadamente de 0.1 a 0.2 por ciento. 

Después, se desarrolla el algoritmo que se 
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b) Subrutina de paso adaptativo 


SUB Adapt (x,y,dy,htry,yscal,eps,hnxt) 

PARAMETER (safety=0.9,econ=1.89e-4) 

h=htry 

DO 
CALL RKkc(y,dy,x,h,ytemp, yerr) 
emax=abs(yerr/yscal/eps) 
IF emax < 1 EXIT 
htemp=safety*h*emax0:2% 
h=max(abs(htemp),0.25*abs(h)) 
xnew=x+h 
IF xnew = x THEN pause 

END DO 

IF emax > econ THEN 
hnxt=safety*emax **h 

ELSE 
hnxt=4.*h 

END IF 

X=X+h 

y=ytemp 

END Adapt 


> 


al 
HARAN 


a) 


b) 


muestra en las figuras 25.21 y 25.22 dentro de un programa computacional y se utiliza para resolver 
el mismo problema. Se elige un tamaño de paso inicial de 0.5 y una e = 0.00005. Los resultados se 
sobreponen en la figura 25.23b. Observe cómo se emplean pasos grandes en las regiones de cambio 
gradual. Después, en la vecindad de x = 2, disminuyen los pasos para tomar en cuenta la naturaleza 


abrupta de la función forzada. 
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Figura 25.22 
Pseudocódigo para: a) 
un programa principal y 
b) una subrutina de paso 
adaptativo para resolver 
una sola EDO. 


En efecto, la utilidad de un esquema de integración adaptativo depende de la naturaleza de las fun- 
ciones que habrán de modelarse. En particular resulta ventajoso en aquellas soluciones con grandes 
tramos suaves y con regiones cortas de cambio abrupto. Además, tiene utilidad en aquellas situacio- 
nes donde no se conoce de antemano el tamaño de paso correcto. En tales casos, la rutina adaptati- 


su camino para la solución manteniendo los resultados dentro de la tolerancia deseada. 


Así, avanzará con pasos pequeños, “de puntillas” por regiones de cambio abrupto y acelerará el paso 
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va “sentirá” 

cuando sean más graduales las variaciones. 
PROBLEMAS 


25.1 Resuelva el siguiente problema de valor inicial en el intervalo 
de 1=0 a 2, donde y(0) = 1. Muestre todos sus resultados en la mis- 
ma gráfica. 
dy 3 
e yt" -1.1y 
a) Analíticamente. 
b) Método de Euler con h =0.5 y 0.25. 
c) Método de punto medio con h=0.5. 
d) Método RK de cuarto orden con h = 0.5. 
25.2 Resuelva el siguiente problema en el intervalo dex=0a l, 
usando un tamaño de paso de 0.25, donde y(0) = 1. Muestre todos 
sus resultados en la misma gráfica. 
dy 
a e 40)v/y 
a) Analíticamente. 
b) Método de Euler. 
c) Método de Heun sin iteración. 
d) Método de Ralston. 
e) Método RK de cuarto orden. 
25.3 Utilice los métodos de a) Euler y b) Heun (sin iteración) para 
resolver: 
2 


dy 

de 
donde y(0) = 2 y y“(0) = 0. Resuelva de x=0 a 4, con h=0.1. Com- 
pare los métodos por medio de graficar las soluciones. 
25.4 Resuelva el problema siguiente con el método de RK de cuar- 
to orden: 

d* d 

Tiro 2+8y=0 

dx dx 
donde y(0) = 4 y y'(0) = 0. Resuelva de x=0 a 5 con h= 0.5. Grafi- 
que sus resultados. 
25.5 Resuelva de 1=0a 3, con A=0.1, con los métodos de a) Heun 
(sin corrector), y b) RK y Ralston de segundo orden: 


0.51+y=0 


d 
2 =ysent(1) y(0)=1 

dt 
25.6 Solucione en forma numérica el problema siguiente, de £=0 
a3: 

dy 2 

—=-2y+t* y(0)=1 

dt 


Utilice el método de RK de tercer orden, con un tamaño de paso de 
0.5. 

25.7 Use los métodos de a) Euler y b) RK de cuarto orden, para 
resolver: 


y - 
—=-2y+5e 
E y 
E 
dx 2 
en el rango de x= 0 a 0.4, con un tamaño de paso de 0.1, con y(0) =2 
y z(0) = 4. 


25.8 Calcule el primer paso del ejemplo 25.14, con el método de RK 
de cuarto orden adaptativo, con h = 0.5. Verifique si el ajuste del 
tamaño del paso está bien. 
25.9 Sig =0.001, determine si se requiere ajustar el tamaño del paso 
para el ejemplo 25.12. 
25.10 Use el enfoque de RK-Fehlberg para llevar a cabo el mismo 
cálculo del ejemplo 25.12, dex=0a1,conh=1. 
25.11 Escriba un programa de computadora con base en la figura 
25.7. Entre otras cosas, incluya comentarios que documenten al 
programa para identificar qué es lo que se pretende realizar en cada 
sección. 
25.12 Pruebe el programa que desarrolló en el problema 25.11 para 
duplicar los cálculos de los ejemplos 25.1 y 25.4. 
25.13 Haga un programa amigable para el usuario para el método 
de Heun con corrector iterativo. Pruébelo con la repetición de los 
resultados de la tabla 25.2. 
25.14 Desarrolle un programa de computadora amigable para el usua- 
rio para el método clásico de RK de cuarto orden. Pruebe el progra- 
ma con la repetición del ejemplo 25.7. 
25.15 Realice un programa de computadora amigable para el usua- 
rio para sistemas de ecuaciones, con el empleo del método de RK de 
cuarto orden. Use este programa para duplicar el cálculo del ejemplo 
25.10. 
25.16 El movimiento de un sistema acoplado masa-resorte (véase la 
figura P25.16) está descrito por la ecuación diferencial ordinaria que 
sigue: 

2 


d d. 
m4 c+ ka =0 
dt dt 
=> Xx 
k 
m C 
UH Y, 
e Y, Y, Z 


Figura P25.16 


donde x = desplazamiento desde la posición de equilibrio (m), t= 
tiempo (s), m = 20 kg masa y c = coeficiente de amortiguamiento 
(N + s/m). El coeficiente de amortiguamiento c adopta tres valores, 5 
(subamortiguado), 40 (amortiguamiento crítico) y 200 (sobreamor- 
tiguado). La constante del resorte es k=20 N/m. La velocidad inicial 
es de cero y el desplazamiento inicial es x = 1 m. Resuelva esta 
ecuación con el uso de un método numérico durante el periodo 0 = 
t= 15 s. Grafique el desplazamiento versus el tiempo para cada uno 
de los tres valores del coeficiente de amortiguamiento sobre la misma 
curva. 

25.17 Si se drena el agua desde un tanque cilíndrico vertical por 
medio de abrir una válvula en la base, el líquido fluirá rápido cuando 
el tanque esté lleno y despacio conforme se drene. Como resultado, 
la tasa a la que el nivel del agua disminuye es: 


D- 5 


dt 


donde k es una constante que depende de la forma del agujero y del 
área de la sección transversal del tanque y agujero de drenaje. La 
profundidad del agua y se mide en metros y el tiempo ten minutos. Si 
k= 0.06, determine cuánto tiempo se requiere para vaciar el tanque 
si el nivel del fluido se encuentra en un inicio a 3 m. Resuelva con la 
aplicación de la ecuación de Euler y escriba un programa de compu- 
tadora en Excel. Utilice un paso de 0.5 minutos. 
25.18 La siguiente es una ecuación diferencial de segundo orden con 
valor inicial: 
ÚUx 
di? 
donde 


+(5x) — +(x+7) sen(owf) =0 


dx 
PO y x(0)=6 


Observe que w = 1. Descomponga la ecuación en dos ecuaciones 
diferenciales de primer orden. Después de la descomposición, resuel- 
va el sistema de £= 0 a 15, y grafique sus resultados. 
25.19 Si se supone que el arrastre es proporcional al cuadrado de la 
velocidad, se puede modelar la velocidad de un objeto que cae, como 
un paracaidista, por medio de la ecuación diferencial siguiente: 
dv Cia 
di m 
donde y es la velocidad (m/s), f = tiempo (s), g es la aceleración 
debida a la gravedad (9.81 m/s?), c,¿= coeficiente de arrastre de se- 
gundo orden (kg/m) y m = masa (kg). Resuelva para la velocidad y 
distancia que recorre un objeto de 90 kg con coeficiente de arrastre 
de 0.225 kg/m. Si la altura inicial es de 1 km, determine en qué 
momento choca con el suelo. Obtenga la solución con a) el método 
de Euler y b) el método de RK de cuarto orden. 
25.20 Un tanque esférico tiene un orificio circular en el fondo a 
través del cual fluye líquido (véase la figura P25.20). La tasa de 
flujo a través del agujero se calcula como: 


0, = CAy2gH 


donde Q,. = flujo de salida (m/s), C= coeficiente obtenido en forma 
empírica, A = área del orificio (m?), g = constante gravitacional (= 
9.81 m/s?) y H= profundidad del líquido dentro del tanque. Emplee 
alguno de los métodos numéricos descritos en este capítulo a fin de 
determinar cuánto tiempo tomaría que el agua fluyera por completo 
de un tanque de 3 m de diámetro con altura inicial de 2.75 m. Obser- 
ve que el orificio tiene un diámetro de 3 cm y C=0.55. 
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Figura P25.20 
Tanque esférico. 


25.21 Para simular una población se utiliza el modelo logístico: 


de Kn 1 PIP más )P 

donde p = población, Kk,, = tasa máxima de crecimiento en condicio- 
nes ilimitadas y pi, es la capacidad de carga. Simule la población 
mundial entre 1950 y 2000, con el empleo de algún método numéri- 
co de los que se describieron en este capítulo. Para la simulación, 
utilice las siguientes condiciones iniciales y valores de parámetros: 
Po (en 1950) = 2555 millones de personas, kg, 0.026/añ0 Y Pmáx = 
12000 millones de personas. Haga que la función genere salidas que 
correspondan a las fechas de los datos siguientes de población. De- 
sarrolle una gráfica de la simulación junto con los datos. 


1960 
3040 


1970 
3708 


1980 
4454 


1990 
5276 


2000 
6079 


t | 1950 
17 | 2555 


25.22 Suponga que un proyectil se lanza hacia arriba desde la super- 
ficie de la Tierra. Se acepta que la única fuerza que actúa sobre el 
objeto es la fuerza debida a la gravedad, hacia abajo. En estas con- 
diciones, se usa un balance de fuerza para obtener, 


2 

S=0 

dt (R+x) 
donde v = velocidad hacia arriba (m/s), f= tiempo (s), x = altitud (m) 
medida hacia arriba a partir de la superficie terrestre, g(0) = acelera- 
ción gravitacional en la superficie terrestre (=9.81 m/s?) y R= radio 
de la Tierra (=6.37 x 10% m). Como dx/dt=V, use el método de Euler 
para determinar la altura máxima que se obtendría si v(t=0)= 1500 
m/s. 
25.23 La función siguiente muestra regiones tanto planas como in- 
clinadas en una región de x relativamente corta: 


1 1 
+ 
(x-0.3 +0.01  (x-0.9)? +0.04 


fFo= 


Determine el valor de la integral definida de la función entre x=0 y 
1, con el método de RK adaptativo. 

25.24 Dadas las condiciones iniciales, y (0)= 1 y y(0)=0, resuelva 
el problema siguiente de valor inicial der=0a4: 

d 2 
—53+4y=0 
aa 


Obtenga sus soluciones con a) el método de Euler y b) el método RK 
de cuarto orden. En ambos casos use tamaño de paso de 0.125. Tra- 
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ce ambas soluciones en la misma gráfica junto con la solución exac- 
ta y =COs 2£. 

25.25 Use las siguientes ecuaciones diferenciales para calcular la 
velocidad y posición de un balón de soccer que es pateado directo 
hacia arriba en el aire con una velocidad inicial de 40 m/s. 


Donde y = distancia hacia arriba (m), £ = tiempo (s), vY = velocidad 
hacia arriba (m/s), g = constante gravitacional (= 9.81 m/s?), c, = 
coeficiente de arrastre (kg/m) y m = masa (kg). Observe que el co- 
eficiente de arrastre se relaciona a más parámetros fundamentales 
por medio de 


1 
lg = qee 


Donde p = densidad del aire (kg/m?), A = área (m?) y C¿el coeficien- 
te de arrastre adimensional. Para los parámetros, use los siguientes 
valores: d =22 cm, m= 0.4 kg, p = 1.3 kg/m? y C¿=0.52. 

25.26 En la figura P25.26 aparecen tres saltadores de bungee unidos. 
Si los cables de bungee están idealizados como resortes lineales (es 
decir, gobernados por la ley de Hooke) se pueden desarrollar las si- 
guientes ecuaciones diferenciales basadas en los equilibrios de 
fuerzas. 


dx; Ml 

my de m8 + ka — Xx1) — Kkix1 
dx, 

ma o m28 + Kid — X2) + Ko(x1 — xo) 
dix, 

m3 e = m38g + k3(%) — x3) 


Donde m, = la masa del saltador i (kg), k; = la constante de resorte 
para el cable j (N/M), x, = el desplazamiento del saltador ¿ medido 
hacia abajo desde su posición de equilibrio (m) y g = aceleración 
gravitacional (9.81 m/s?). Resuelva estas ecuaciones para las posi- 
ciones y velocidades de los tres saltadores dado que las condiciones 
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iniciales de todas las posiciones y velocidades son cero en £= 0. Use 
los siguientes parámetros en sus cálculos: m, =60 kg, m,=70 kg, m3 
=80 kg, k, =k3= 50 y k, = 100 (N/m). 


| | 
x=0 p====-=-- 
DN A | 
x=0 p====-=-=- | 


Figura P25.26 
Tres individuos unidos con cables de bungee. a) No estirado, 
b) Estirado. 


múltiples 


El presente capítulo cubre dos áreas de estudio. Primero, describimos las EDO rígidas. Éstas son 
tanto EDO en forma individuales como sistemas de EDO, que tienen componentes rápidos y lentos 
para su solución. Presentamos la idea de una técnica de solución implícita como una respuesta co- 
múnmente utilizada para este problema. Después analizamos los métodos de pasos múltiples o 
multipaso. Estos algoritmos guardan información de pasos anteriores para obtener de manera más 
efectiva la trayectoria de la solución; también ofrecen la estimación del error de truncamiento que 
se utiliza para implementar el control adaptativo del tamaño de paso. 


26.1 RIGIDEZ 


El término rigidez constituye un problema especial que puede surgir en la solución de ecuaciones 
diferenciales ordinarias. Un sistema rígido es aquel que tiene componentes que cambian rápidamen- 
te, junto con componentes de cambio lento. En muchos casos, los componentes de variación rápida 
son efímeros, transitorios, que desaparecen, después de lo cual la solución es dominada por compo- 
nentes de variación lenta. Aunque los fenómenos transitorios existen sólo en una pequeña parte del 
intervalo de integración, pueden determinar el tiempo en toda la solución. 

Tanto las EDO individuales como los sistemas pueden ser rígidos. Un ejemplo de una EDO rí- 
gida es: 


dy 
dt 


Si y(0) = 0, la solución analítica que se obtiene es: 


=-1000y +3 000 —2 000e* (26.1) 


y =3-0.998e*%% _2.002e* (26.2) 


Como se muestra en la figura 26.1, la solución al principio se encuentra dominada por el térmi- 
no exponencial rápido (e”! 0). Después de un periodo muy corto (+ < 0.005), esta parte transistoria 
termina y la solución se regirá por el exponencial lento (e””). 

Al examinar la parte homogénea de la ecuación (26.1), se conoce el tamaño de paso necesario 
para la estabilidad de tal solución: 


0 (26.3) 


Si y(0) = yo, puede usarse el cálculo para determinar la solución 
y=yMe" 


Así, la solución empieza en yy y asintóticamente se aproxima a cero. 
Es factible usar el método de Euler para resolver el mismo problema en forma numérica: 


dy, 
a ¡=y+h 
Yiri Hi dt 


Al sustituir la ecuación (26.3) se tiene 


Yi+1 =)¡- dy¡h 
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Figura 26.1 


Gráfica de una solución rígida para una sola EDO. Aunque la 
solución parece iniciar en 1, en realidad existe una forma transi- 
toria rápida desde y = O hasta 1, que ocurre en menos de 0.005 
unidades de tiempo. Esta transición es perceptible sólo cuando la 
respuesta se observa sobre una escala de tiempo más fina en ese 


intervalo. 
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Yi+1 =)Y ¡(1 — ah) (26.4) 
1- ah! debe ser 


La estabilidad de esta fórmula, sin duda, depende del tamaño de paso h. Es decir, 
menor que 1. Entonces, si h > 2/a, y, > oo conforme ¡ > oo, 

En la parte transitoria rápida de la ecuación (26.2) se utiliza este criterio con la finalidad de 
mostrar que para mantener la estabilidad el tamaño de paso debe ser < 2/1000 = 0.002. Además, 
deberá observarse que mientras este criterio mantiene la estabilidad (es decir, una solución acotada), 
sería necesario un tamaño de paso aún más pequeño para obtener una solución exacta. Así, aunque 
la parte transitoria se presenta sólo en una pequeña fracción del intervalo de integración, ésta con- 
trola el tamaño de paso máximo permitido. 

Sin ahondar mucho, se podrá suponer que las rutinas adaptativas de tamaño de paso descritas 
al final del capítulo ofrecerán una solución a este problema. Quizá pensará que tales rutinas usarían 
pasos pequeños en las partes transistorias rápidas y pasos grandes en las otras. Sin embargo, éste no 
es el caso, ya que para los requerimientos de estabilidad se necesitarán pasos muy pequeños en toda 
la solución. 

En lugar de usar procedimientos explícitos, los métodos implícitos ofrecen una solución alter- 
nativa. Tales representaciones se denominan implícitas, debido a que la incógnita aparece en ambos 
lados de la ecuación. Una forma implícita del método de Euler se desarrolla evaluando la derivada 
en el tiempo futuro, 

dy, 

dia Dor a 
A esto se le llama: método de Euler hacia atrás o implícito. Si se sustituye la ecuación (26.3) se 
llega a: 


Yi+1 = Y; MY ¡41% 


de donde se obtiene: 


y. 
y 26.5 
2 dh id 


En este caso, sin importar el tamaño de paso, yl > 0 conforme ¡ > oo. De ahí que el procedimien- 


to se llame incondicionalmente estable. 


EJEMPLO 26.1 Euler explícito e implícito 


Planteamiento del problema Con los métodos explícito e implícito de Euler resuelva 


a =-1000y+3 000 —2 000€ * 


donde y(0) = 0. a) Use el método de Euler explícito con tamaños de paso de 0.0005 y 0.0015 para 
encontrar y entre £= 0 y 0.006. b) Utilice el método implícito de Euler con un tamaño de paso de 
0.05 para encontrar y entre O y 0.4. 


26.1 Rigidez 589 


Figura 26.2 
Solución de una EDO “rígida” con los métodos de Euler a) explícito el 
y b) implícito. 155 a h= 0.0015 
E NS A Z 
a / N AA A 
dr 
Solución ) o 05 - Exacto 
a) En este problema, el método explícito de Euler es: - h = 0.0005 
Yi+1 = Y; + (1 000y, + 3000 — 2000€e")h 


0 - 
] .002 .004 E t 
El resultado para h = 0.0005 se despliega en la figura 26.2a E Es a Mies das 
junto con la solución analítica. Aunque muestre algún error yA 
de truncamiento, el resultado capta la forma general de la ob 


solución analítica. En cambio, cuando el tamaño de paso se E 
incrementa a un valor justo debajo del límite de estabilidad (h 
= 0.0015), la solución presenta oscilaciones. Usando h > 0.002 
se tiene como resultado una solución totalmente inestable; es 
decir, la solución tenderá al infinito conforme se avanza en 
las iteraciones. 

b) El método de Euler implícito es: 


Yi. 1= y, + (=1000y,, , + 3000 — 2000€*-")h 


Ahora como la EDO es lineal, se reordena esta ecuación de tal 
forma que y; ¡ quede sola en el lado izquierdo, 

Es y, + 30004 — 2 000he *" 

ds 1+ 10007 


El resultado con h = 0.05 se muestra en la figura 26.2b junto con la solución analítica. Observe 
que aun cuando usamos un tamaño de paso mucho mayor que aquel que indujo la inestabilidad 
en el método de Euler explícito, la solución numérica se ajusta muy bien al resultado analítico. 


Los sistemas de EDO también pueden ser rígidos. Un ejemplo es: 


dy 
0 = Sy, +3, (26.64) 
=> =100y, -301y, (26.6b) 


Para las condiciones iniciales y¡(0) = 52.29 y y,(0) = 83.82, la solución exacta es: 
y¡ = 52.96e73989%% — 67230201011 (26.7a) 
e e ad dto (26.7b) 


Observe que los exponentes son negativos y difieren por cerca de 2 órdenes de magnitud. Como en 
una sola ecuación, los exponentes grandes son los que responden rápidamente y representan la esen- 
cia de la rigidez del sistema. 

Para este ejemplo el método implícito de Euler para sistemas se formula como 


Mir = Yi OS Ys + Yo ¡+ A (26.8a) 

Yai+1 = Ya, + (100y1 ¡4 1 — 301 ¡4 1)h (26.8b) 
Al agrupar términos se tiene 

C++ SM ii AY +12 Y (26.9a) 


—100hy; ¿41 + (1 + 30110)» ¡+1= Y, (26.9b) 
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Así, notamos que el problema consiste en resolver un conjunto de ecuaciones simultáneas en cada paso. 

Para EDO no lineales, la solución se vuelve aún más difícil, ya que debe resolverse un sistema 
de ecuaciones simultáneas no lineales (recuerde la sección 6.6). Así, aunque se gana estabilidad a 
través de procedimientos implícitos, se paga un precio al agregar mayor complejidad a la solución. 

El método implícito de Euler es incondicionalmente estable y tiene sólo una exactitud de primer 
orden. También es posible desarrollar de manera similar un esquema de integración para la regla del 
trapecio implícita de segundo orden para sistemas rígidos. En general, es preferible tener métodos de 
orden superior. Las fórmulas de Adams-Moulton descritas después, en este capítulo, también son 
útiles para determinar métodos implícitos de orden superior. Sin embargo, los límites de estabilidad 
de tales procedimientos son muy rigurosos cuando se aplican a sistemas rígidos. Gear (1971) desa- 
rrolló una serie especial de esquemas implícitos que tienen límites de estabilidad más grandes, basa- 
dos en las fórmulas de diferencias hacia atrás. Se ha hecho un trabajo muy fuerte para desarrollar el 
software que implemente los métodos de Gear en forma eficiente. Dando como resultado que sea 
probablemente el método más utilizado para resolver sistemas rígidos. Además, Rosenbrock y otros 
(véase Press y colaboradores, 2007) han propuesto algoritmos implícitos, de Runge-Kutta, donde los 
términos k aparecen en forma implícita. Dichos métodos poseen buenas características de estabilidad 
y son bastante adecuados para resolver sistemas de ecuaciones diferenciales ordinarias rígidas. 


26.2 MÉTODOS DE PASOS MÚLTIPLES 


Los métodos de un paso que se describieron en las secciones anteriores utilizan información de un 
solo punto x, para predecir un valor de la variable dependiente, y;, ,, en un valor futuro, de la varia- 
ble x;, ¡ (figura 26.3a). Los procedimientos alternativos, llamados métodos de pasos múltiples O 
multipasos (figura 26.3b), se basan en que, una vez empezado el cálculo, se tiene a disposición in- 
formación de los puntos anteriores. La curvatura de las líneas que unen esos valores previos ofrecen 
información respecto a la trayectoria de la solución. Los métodos de pasos múltiples explorados en 
este capítulo aprovechan tal información para resolver las EDO. Antes de describir las versiones de 
orden superior, presentaremos un método simple de segundo orden que sirve para demostrar las 
características generales de los procedimientos multipaso. 


26.2.1 El método de Heun sin autoinicio 


Recuerde que el procedimiento de Heun utiliza el método de Euler como un predictor [ecuación 
(25.15)]: 


Yi+1 = Yi +A) y oh (26.10) 
y la regla del trapecio como un corrector [ecuación (25.16)]: 


0 
| (26.11) 


MAS 


Así, el predictor y el corrector tienen errores 
YA de truncamiento local de O(4?) y O(h3), 
respectivamente. Esto sugiere que el predic- 
tor es la parte débil en el método, a causa de 
que tiene el error más grande. Esta debilidad 
es significativa puesto que la eficiencia del 
paso corrector depende de la exactitud de la 
predicción inicial. En consecuencia, una 


Figura 26.3 
Representación gráfica de la diferencia fun- 
damental entre los métodos a) de un paso 


a) 


Xy] X Xiao Xi X; ES y b) de pasos múltiples para la solución de 
») EDO. 


forma de mejorar el método de Heun consiste en desarrollar un 
predictor que tenga un error local de O(A?). Esto se obtiene usan- 
do el método de Euler y la pendiente en y,, así como una informa- 
ción extra de un valor anterior y;_ , como en: 


Mer =)Y 1 + HA%, y )2h (26.12) 


Observe que la ecuación (26.12) alcanza O(h*) a expensas de 
emplear un tamaño de paso mayor, 2h. Además, note que la ecua- 
ción (26.12) no es de autoinicio, ya que necesita un valor previo 
de la variable dependiente y;_ ¡. Tal valor no está disponible en un 
problema común de valor inicial. Por ello, las ecuaciones (26.11) 
y (26.12) se denominan método de Heun sin autoinicio. 

Como se indica en la figura 26.4, la derivada estimada para la 
ecuación (26.12) se localiza ahora en el punto medio y no al inicio 
del intervalo sobre el cual se hace predicción. Como se consideró 
anteriormente, esta ubicación centrada mejora el error del predictor 
a O(h*). Sin embargo, antes de realizar una deducción formal del 
método de Heun sin autoinicio, lo resumiremos y lo expresaremos 
utilizando una nomenclatura ligeramente modificada: 


Predictor: y, =Y",+£(,,y)2h (26.13) 


m j=1 
Corrector: a y y LY A (26.14) 
(para ¡= 1, 2,..., m) 


donde los superíndices se agregaron para denotar que el corrector 
se aplica iterativamente desde j = 1 hasta m para obtener mejores 
soluciones. Observe que y” y y”_ , son los resultados finales del 
corrector en los pasos anteriores. Las iteraciones terminan en 
cualquier paso considerando el criterio de terminación: 


j jol 
YisiT Yi+1 
j 

+1 


100% (26.15) 


Cuando e, es menor que una tolerancia de error e, preestablecida, 
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y/ Pendiente = f(x;, 1, y?_ 1) 


Pendiente = L4+-Y0 + e Y1-1) di-1) 
yA 2 


=Y 


Figura 26.4 

Representación gráfica del método de Heun sin autoini- 
cio. a) El método de punto medio que se utiliza como un 
predictor. b) La regla del trapecio que se emplea como 
un corrector. 


concluyen las iteraciones. En este 


momento, j¡ = m. El uso de las ecuaciones (26.13) a (26.15) para resolver una EDO se demuestra en 


el siguiente ejemplo. 


EJEMPLO 26.2 Método de Heun sin autoinicio 


Planteamiento del problema Con el método de Heun sin autoinicio realice los mismos cálcu- 
los como en el ejemplo 25.5 donde se usó el método de Heun. Es decir, integre y” = 4e%* — (.5y y 
desde x = O hasta x = 4 con un tamaño de paso de 1.0. Igual que en el ejemplo 25.5, la condición 
inicial en x=0 es y =2. Sin embargo, como aquí tenemos un método de pasos múltiples, requerimos 
de información adicional, considerando que y = -0.3929953 en x=-1. 


Solución El predictor [ecuación (26.13)] se utiliza para extrapolar linealmente dex=-1ax=1. 


y) =-0.3929953 + [4080 — 0,5(2)]2 = 5.607005 


El corrector [ecuación (26.14)] se usa después para calcular el valor: 


48059 —0,5(2)+4e9* —0.5(5.607005) 
2 


y, =2+ 


1 =6.549331 
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que representa un error relativo porcentual de -5.73% (valor verdadero = 6.194631). Este error es 
más pequeño que el valor de -8.18% en el que se incurre con el método de Heun de autoinicio. 
Ahora, se aplica la ecuación (26.14) de manera iterativa para mejorar la solución: 


E 3+4e 0 -0.5(6.549331) 
Yi > 


que representa un e, de -1.92%. Se determina un estimado del error utilizando la ecuación (26.15): 


1=6.313749 


_[6.313749—6.549331 
6.313749 


100% =3.7% 


a 


La ecuación (26.14) se aplica de manera iterativa hasta que e, esté por debajo de un valor preespe- 
cificado de £,. Como fue el caso con el método de Heun (recuerde el ejemplo 25.5), las iteraciones 
convergen a un valor de 6.360865 (e, = 2.68%). Sin embargo, como el valor del predictor inicial es 
más exacto, el método de pasos múltiples converge más rápido. 

En el segundo paso, el predictor es: 


y =2 + [4e080 — 0,5(6.360865)]2 = 13.44346 €, = 9.43% 


el cual es mejor que la predicción de 12.08260 (e,= 18%) calculada con el método de Heun original. 
El primer corrector da 15.76693 (£,= 6.8%); las siguientes iteraciones convergen al mismo resultado 
como en el método de Heun de autoinicio: 15.30224 (e, =-3.1%). Observe que en el paso anterior, 
la rapidez de convergencia del corrector es mayor debido a la mejoría de la predicción inicial. 


Deducción y análisis del error de las fórmulas del predictor-corrector Ya empleamos 
conceptos gráficos para deducir el método de Heun sin autoinicio. Ahora mostraremos cómo las 
mismas ecuaciones se pueden deducir en forma matemática. Tal deducción es interesante en especial 
porque vincula los conceptos de ajuste de curvas, de integración numérica y de EDO. La deducción 
también es útil porque ofrece un procedimiento simple para desarrollar métodos de pasos múltiples 
de orden superior y una estimación de sus errores. 

La deducción se basa en resolver la EDO general 

dy 


a Y 


Esta ecuación se resuelve multiplicando ambos lados por dx e integrando entre los límites ¡e ¡+ 1: 
["a=[" 56, y dx 

El lado izquierdo se integra y evalúa mediante [recuerde la ecuación (25.21)]: 
Y = Y +7" F(x, y) de (26.16) 


La ecuación (26.16) representa una solución a la EDO si la integral puede evaluarse. Es decir, 
proporciona un medio para calcular un nuevo valor de la variable dependiente y;, , a partir de un 
valor previo y, y del conocimiento de la ecuación diferencial. 

Las fórmulas de integración numérica como las que se desarrollaron en el capítulo 21 propor- 
cionan una manera de realizar esta evaluación. Por ejemplo, la regla del trapecio [ecuación (21.3)] 
se utiliza para evaluar la integral, como sigue: 


PIDA dia y, 
2 


"50 y dr= (26.17) 


donde h = x;, ¡ — x, es el tamaño de paso. Sustituyendo la ecuación (26.17) en la ecuación (26.16) se 
tiene: 
AIDA die y, 

2 


dia Y, + 
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que es el paso corrector para el método de Heun. Como esta ecuación se basa en la regla del trapecio, 
el error de truncamiento se puede tomar directamente de la tabla 21.2: 


1 3,6 1 3 
E.=-—hyE)=-—Hpf" (26.18) 
raid (E) 2 PU 
donde el subíndice c indica que éste es el error del corrector. 
Se utiliza un procedimiento similar para obtener el predictor. En este caso, los límites de inte- 
gración seráni-1leiw+l: 


Yi+1 


dy=" Fax 


y 
i-1 


que se integra y se reordena para tener 
A IE dx (26.19) 


Ahora, no se emplea una fórmula cerrada de la tabla 21.2, sino que se utiliza la primera fórmula de 
integración abierta de Newton-Cotes (véase tabla 21.4) para evaluar la integral, como sigue: 


[7 fa yax=2HfG,,y) (26.20) 


Xi 


que se llama método del punto medio. Sustituyendo la ecuación (26.20) en la ecuación (26.19) se 
obtiene: 


dis = Yi 1 + 2Mf(X) y) 


el cual es el predictor para el método de Heun sin autoinicio. Como en el corrector, el error de trun- 
camiento local se puede tomar directamente de la tabla 21.4: 


1 1 
E, = UY) = GS E) (26.21) 
donde el subíndice p indica que éste es el error del predictor. 

Así, el predictor y el corrector en el método de Heun sin autoinicio tiene errores de truncamien- 
to del mismo orden. Además de actualizar la exactitud del predictor, este hecho tiene ventajas adi- 
cionales relacionadas con el análisis del error, como se verá en la siguiente sección. 


Estimación de errores Si el predictor y el corrector de un método de pasos múltiples son del 
mismo orden, el error de truncamiento local puede estimarse en el proceso de cada cálculo. Esto 
representa una enorme ventaja, ya que establece un criterio para el ajuste del tamaño de paso. 

El error de truncamiento local del predictor se estima con la ecuación (26.21). Dicho error es- 
timado se combina con el estimado de y; ¡ del paso predictor para dar [recuerde nuestra definición 
básica en la ecuación (3.1)]: 


1 
Valor verdadero = yaa dj YE) (26.22) 


Usando un procedimiento similar, el error estimado para el corrector [ecuación (26.18)] se combina 
con el resultado del corrector y;, ¡ para llegar a: 


1 
Valor verdadero = y? , — prYn6) (26.23) 


La ecuación (26.22) se resta de la ecuación (26.23) para tener: 


A 5 
== PO (26.24) 


donde £ está ahora entre x;_ ¡ y x;, ¡ Ahora, si se divide la ecuación (26.24) entre 5 y se reordena el 
resultado se obtiene: 
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0 —_4 3." 
Yi TY ia 


1 
=-— py 26.25 
P il (5) (26.25) 


Observe que los lados derechos de las ecuaciones (26.18) y (26.25) son idénticos, con excepción del 
argumento de la tercera derivada. Si la tercera derivada no tiene una variación apreciable en el in- 
tervalo dado, supondremos que los lados derechos son iguales y, por lo tanto, los lados izquierdos 
deberían ser equivalentes, como: 


0 m 
ENE YiviT dira 
3 
Así, llegamos a una relación que puede utilizarse para estimar el error de truncamiento por paso con 
base en dos cantidades [el predictor (y? ¡) y el corrector (y”, ¡)], que son producidos durante el cálculo. 


(26.26) 


EJEMPLO 26.3 Estimación del error de truncamiento por paso 


Planteamiento del problema Conla ecuación (26.26) estime el error de truncamiento por paso 
del ejemplo 26.2. Observe que los valores verdaderos en x= 1 y 2 son 6.194631 y 14.84392, respec- 
tivamente. 


Solución En x;,¡= 1, el predictor es 5.607005 y el corrector es 6.360865. Se sustituyen estos 
valores en la ecuación (26.26): 


E = 6.360865—5.607005 _ 


A 5 0.1507722 


que no está lejos del error exacto, 
E,= 6.194631 — 6.360865 =-0.1662341 
En x;, 1 = 2, el predictor es 13.44346 y el corrector es 15.30224, que se utiliza para calcular: 


15.30224 —13.44346 _ 


E, = 0.3717550 


ú 3 
que tampoco está lejos del error exacto, E, = 14.84392 — 15.30224 = -0.4583148. 


La facilidad con que se estima el error mediante la ecuación (26.26) proporciona una buena 
forma de ajustar el tamaño de paso, durante el proceso de cada cálculo. Por ejemplo, si la ecuación 
(26.26) indica que el error es mayor que un nivel aceptable, el tamaño de paso podrá disminuirse. 


Modificadores Antes de analizar los algoritmos de cómputo, es necesario observar otras dos 
maneras en que el método de Heun sin autoinicio puede volverse más exacto y eficiente. Primero, 
habrá que percatarse de que además de ofrecer un criterio para el ajuste del tamaño de paso, la 
ecuación (26.26) representa una estimación numérica de la discrepancia entre el valor final corregi- 
do en cada paso y;, ¡ y el valor verdadero. Así, ésta puede sumarse directamente a y, , para mejorar 
aún más el estimado: 


m 0 
Yi Yi 


26.27 
5 ( ) 


Vier is 
La ecuación (26.27) se conoce como modificador del corrector. (El símbolo — se lee “es reempla- 
zado por”.) El lado izquierdo es el valor modificado de y”, ¡. 

Una segunda mejoría relacionada más con la eficiencia del programa es un modificador del 
predictor, que está diseñado para ajustar el resultado del predictor de forma que está más cerca al 
valor convergente final del corrector. Esto resulta ventajoso debido a que, como se observó al inicio 
de esta sección, el número de iteraciones del corrector es altamente dependiente de la exactitud de 
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la predicción inicial. En consecuencia, si la predicción se modifica en forma adecuada, podríamos 
reducir el número de iteraciones necesarias para converger al último valor del corrector. 

Tal modificador puede deducirse en forma sencilla al suponer que la tercera derivada es relati- 
vamente constante de un paso a otro. Por lo tanto, usando el resultado del paso previo en i, de la 
ecuación (26.25) se puede despejar 


my (E) = o =37) (26.28) 
suponiendo que y“X(5) = y“Xó,), se sustituye en la ecuación (26.21) para dar 

E, = Sor y) (26.29) 
que se utiliza después para modificar el resultado del predictor: 


4 m 
Ma LOT (2630) 


EJEMPLO 26.4 Efecto de los modificadores sobre los resultados del predictor-corrector 
Planteamiento del problema Vuelva a calcular el ejemplo 26.3 empleando ambos modificadores. 


Solución Como en el ejemplo 26.3, el resultado del predictor inicial es 5.607005. Ya que el mo- 
dificador del predictor [ecuación (26.30)] requiere valores de una iteración previa, no es posible 
emplearlo para mejorar este resultado inicial. Sin embargo, la ecuación (26.27) sirve para modificar 
el valor corregido de 6.360865 (e, = -2.6849%), como sigue: 


y" =6.360865 AS =6.210093 


que representa un e, = 0.25%. Así, el error se reduce en un orden de magnitud. 
En la siguiente iteración, el predictor [ecuación (26.13)] se usa para calcular 


y9=2 + [46080 - 0.5(6.210093)]2 =13.59423  £,=8.42% 


que es aproximadamente la mitad del error del predictor para la segunda iteración del ejemplo 26.3, 
es decir, e, = 18.6%. Esta mejoría ocurre debido a que utilizamos aquí una mejor estimación de y 
(6.210093 en lugar de 6.360865) en el predictor. En otras palabras, los errores propagado y global 
se reducen al incluir el modificador del corrector. 

Ahora debido a que tenemos información de la iteración anterior, la ecuación (26.30) se emplea 
para modificar el predictor, como sigue: 


y? =13.59423+ (6360865 = 5.607005) =14.19732 €, = 4.36% 


que, de nuevo, reduce el error a la mitad. 

Esta modificación no tiene efecto en el resultado final del siguiente paso del corrector. Sin 
importar si se usan los predictores modificados o no modificados, el corrector, al final, convergerá 
a la misma respuesta. No obstante, como la rapidez o eficiencia de convergencia depende de la exac- 
titud de la predicción inicial, la modificación puede reducir el número de iteraciones requerido para 
la convergencia. 

La implementación del corrector da un resultado de 15.21178 (e, =-—2.48%), el cual representa 
una mejora sobre el ejemplo 26.3 debido a la reducción del error global. Por último, tal resultado se 
puede modificar usando la ecuación (26.27): 

15.21178 — 13.59423 


y, =15.21178 5 = 14.88827 €, = 0.30% 


De nuevo, el error se redujo en un orden de magnitud. 
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Como en el ejemplo anterior, al incluir los modificadores se incrementó tanto la eficiencia como 
la exactitud de los métodos de pasos múltiples. En particular, el modificador del corrector incrementa 
efectivamente el orden de la técnica. Así, el método de Heun sin autoinicio con modificadores es de 
tercer orden y no de segundo orden, como en el caso de la versión no modificada. Aunque deberá ob- 
servarse que hay situaciones donde el modificador del corrector afectará la estabilidad del proceso de 
iteración del corrector. En consecuencia, el modificador no se incluye en el algoritmo de Heun sin 
autoinicio que se presenta en la figura 26.5. A menos que el modificador del corrector todavía pueda 
tener utilidad en el control del tamaño de paso, como se analizará después. 


26.2.2 Control del tamaño de paso y programas computacionales 


Tamaño de paso constante Es relativamente simple desarrollar una versión con tamaño de paso 
constante del método de Heun sin autoinicio. La única complicación es que se requiere de un método 
de un paso para generar el punto extra necesario para iniciar el cálculo. 

Además, como se emplea un tamaño de paso constante, se debe elegir un valor para h antes 
de los cálculos. En general, la experiencia indica que un tamaño de paso óptimo deberá ser lo 
suficientemente pequeño para asegurar la convergencia con dos iteraciones del corrector (Hull y 
Creemer, 1963). Además, debe ser lo suficientemente pequeño para dar un error de truncamiento 
lo suficientemente pequeño. Al mismo tiempo, el tamaño de paso deberá ser tan grande como sea 
posible para minimizar el costo de ejecución y el error de redondeo. Como se hizo con los otros 
métodos para EDO, la única forma práctica para evaluar la magnitud del error global es comparar 
los resultados del mismo problema utilizando la mitad del tamaño de paso. 


Tamaño de paso variable Normalmente se utilizan dos criterios para decidir si se justifica un 
cambio de tamaño de paso. Primero, si la ecuación (26.26) es mayor que algún criterio de error 
preespecificado, se disminuye el tamaño de paso. Segundo, se elige el tamaño de paso de manera 
tal que el criterio de convergencia del corrector se satisfaga con dos iteraciones. Este criterio busca 
tomar en cuenta las ventajas y las desventajas entre la rapidez de convergencia y el número total de 
pasos en el cálculo. Para valores más pequeños de h la convergencia será más rápida, pero se re- 
quieren más pasos. Para valores más grandes de h la convergencia se vuelve más lenta, pero se 
tiene un menor número de pasos. La experiencia (Hull y Creemer, 1963) sugiere que el total de 
pasos se minimizará si h se elige de tal forma que el corrector converja en dos iteraciones. Por lo 


Predictor: 
o. _ 


Ya = Y PA FO y 72h 


(Guarde el resultado como y?, ; , =y?, 1, donde el subíndice u designa que la variable no 
está modificada.) 


Modificador del predictor: 


4 m 
Ya Ya FEV Y A) 


5 

Corrector: 

o IIA Y 52) l la il 
y; yr4 h (para ¡= 1 a máximo m iteraciones) 

+1 Í 2 . 

Figura 26.5 
Verificación del error: Secuencia de fórmulas usadas para imple- 
Yoo ya mentar el método de Heun sin autoinicio. 
e == 100% Observe que es posible utilizar la estimación 
dd del error del corrector para modificar el 


(Si Je ¿| > criterio de error, hacer ¡= + 1 y repita el corrector; si €, < criterio de error, guarde corrector. Sin embargo, como esto llega a 


el resultado como y 7, ¡. =y 7,1.) afectar la estabilidad del corrector, el modi- 
ficador no se incluye en este algoritmo. La 

Estimación del error del corrector: estimación del error del corrector se incluye 

E ==) debido a su utilidad en el ajuste del tamaño 


de paso. 


(Si el cálculo continúa, hacer ¡= ¡+ 1 y regrese al predictor.) 
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tanto, si se quieren más de dos iteraciones, el tamaño de paso se 
disminuye; y si se requieren menos de dos iteraciones el tamaño 
de paso se incrementa. 

Aunque la estrategia anterior especifica el momento en que 
las modificaciones del tamaño de paso es el adecuado, no indica 
cómo habrá que cambiarlas. Ésta es una situación crítica, ya que 
los métodos de pasos múltiples requieren de varios puntos previos 


Interpolación 
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para calcular un nuevo punto. Una vez que se cambie el tamaño 
de paso, debe determinarse un nuevo conjunto de puntos. Un 
procedimiento es comenzar de nuevo los cálculos y usar el méto- yA 
do de un paso para generar un nuevo conjunto de puntos de inicio. 

Una estrategia más eficiente que utiliza la información 
existente consiste en aumentar y disminuir el tamaño de paso, 
mediante su duplicación o reducción a la mitad. Como se ilustra 
en la figura 26.6b, si se ha generado un número suficiente de 


a) 


valores previos, aumentar el tamaño de paso por duplicación A A A 


será una tarea relativamente directa (figura 26.6c). Todo lo que 
se necesita es rastrear los subíndices de tal forma que los valores yA 
anteriores de x y de y sean los nuevos valores apropiados. La 
reducción del tamaño de paso a la mitad es más complicada, ya 
que algunos de los nuevos valores no estarán disponibles (figu- 
ra 26.6a). Aunque se puede utilizar la interpolación polinomial 
del tipo que se desarrolló en el capítulo 18 para determinar estos 
valores intermedios. 

En cualquier caso, la decisión de incorporar el control del 
tamaño de paso representa ventajas y desventajas entre la inversión c) 
inicial por la complejidad del programa contra los dividendos a 
largo plazo que se tendrán con el aumento en la eficiencia. En 
efecto, la magnitud e importancia del problema mismo tendrá un 


b) 


Figura 26.6 


Una gráfica que muestra cómo la estrategia de disminuir 


gran peso en dicha elección. Por fortuna, varios paquetes de soft- ¿la mitad y duplicar el paso permite el uso de b) valores 


ware y bibliotecas tienen las rutinas de pasos múltiples que usted calculados previamente con un método de pasos múltiples 
puede utilizar para obtener soluciones sin necesidad de progra- de tercer orden. a) Disminuyendo a la mitad; c) duplicando. 


marlas desde las pruebas de escritorio. Mencionaremos algunas 
de éstas cuando revisemos los paquetes y las bibliotecas al final 
del capítulo 27. 


26.2.3 Fórmulas de integración 


El método de Heun sin autoinicio es característico de la mayoría de los métodos de pasos múltiples. 
Emplea una fórmula de integración abierta (el método del punto medio) para realizar una estimación 
inicial. Este paso predictor requiere un punto previo. Después, se aplica de manera iterativa una 
fórmula de integración cerrada (la regla del trapecio) para mejorar la solución. 

Será evidente que una estrategia para mejorar los métodos de pasos múltiples será el uso de 
fórmulas de integración de orden superior como predictores y correctores. Por ejemplo, las fórmulas 
de Newton-Cotes de orden superior desarrolladas en el capítulo 21 se podrían utilizar para este 
propósito. 

Antes de realizar una descripción de estos métodos de orden superior, revisaremos las fórmulas 
de integración más comunes en las que se basan. Como se mencionó antes, las primeras de éstas son 
las fórmulas de Newton-Cotes. No obstante, hay una segunda clase llamada fórmulas de Adams que 
también revisaremos y que a menudo se prefieren. Como se indica en la figura 26.7, la diferencia 
fundamental entre las fórmulas de Newton-Cotes y las de Adams tiene que ver con la manera en la 
cual se aplica la integral para obtener la solución. Como se muestra en la figura 26.7a, las fórmulas 
de Newton-Cotes estiman la integral en un intervalo generando varios puntos. Esta integral se usa 
entonces para proyectar la curva desde el inicio del intervalo hasta el final. En cambio, las fórmulas 
de Adams (figura 26.7b) emplean un conjunto de puntos de un intervalo para estimar únicamente la 
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Z Figura 26.7 
YA b Eee Ilustración de la diferencia fundamental entre las fórmulas de inte- 
Masa == iaa FG, y) dx p 
baza gración de Newton-Cotes y de Adams. a) Las fórmulas de Newton- 
Cotes utilizan una serie de puntos para obtener una estimación de 


la integral sobre varios segmentos. La estimación se usa después 
para proyectar la curva a través de todo el intervalo. b) Las fórmu- 


S 
S 
SS 4 S las de Adams usan una serie de puntos para obtener la estimación 
SS SS de la integral de un solo segmento. La estimación después se utili- 
SS Za para proyectar la curva a través del segmento. 


da on d dea x integral del último segmento del intervalo. Esta integral se usa 
a) después para proyectar a través de este último segmento. 
YA Xi 1 2 _ ye S 
e [ Ed Fórmulas de Newton Cotes Algunas de las fórmulas más 
X; conocidas para resolver ecuaciones diferenciales ordinarias se ba- 


san en ajustar un polinomio de interpolación de n-ésimo grado a 
n + 1 valores conocidos de y y, después esta ecuación, se utiliza 
para calcular la integral. Como se analizó antes en el capítulo 21, 
las fórmulas de integración de Newton-Cotes se basan en tal proce- 
dimiento y son de dos formas: abiertas y cerradas. 


Fórmulas abiertas Para n valores igualmente espaciados, las 
fórmulas abiertas se pueden expresar en la forma de una solución 


ES e E E x para una EDO, como se hizo antes para la ecuación (26.19). La 
b) ecuación general para este propósito es 
Mi+1 
Y = Yin +" A (26.31) 


donde f;,() es un polinomio de interpolación de n-ésimo grado. La evaluación de la integral emplea la 
fórmula de integración abierta de Newton-Cotes de n-ésimo orden (tabla 21.4). Por ejemplo, sin = 1, 


Yi+1=Y¡-1 + 2hf; (26.32) 


donde f; es una abreviatura de f(x, y,); es decir, la ecuación diferencial evaluada en x, y y; Se hace 
referencia a la ecuación (26.32) como el método de punto medio y se utilizó antes como el predictor 
en el método de Heun sin autoinicio. Para n = 2, 


3h 
Visa Yjoa + SU +1) 
y para n =3, 
4h 
Yi Yi FO fi +22) (26.33) 
La ecuación (26.33) se representa gráficamente en la figura 26.84. 
Fórmulas cerradas La forma cerrada se expresa de manera general como 
Y = Yin HS" £,00 de (26.34) 


“i-n+1 


donde la integral se determina por una fórmula de integración cerrada de Newton-Cotes de n-ésimo 
orden (tabla 21.2). Por ejemplo, paran =1, 


h 
Yir1 SO) 


que es equivalente a la regla del trapecio. Para n = 2, 
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YY ta (26.35) a 


que es equivalente a la regla de Simpson 1/3. La ecuación (26.35) 
se representa en la figura 26.8b. 


Fórmulas de Adams Los otros tipos de fórmulas de integración 
que se utilizan para resolver EDO son las fórmulas de Adams. 
Muchos algoritmos de uso generalizado para la solución de EDO 
por multipaso se basan en dichos métodos. 


Fórmulas abiertas (Adams-Bashforth) Las fórmulas de 
Adams se deducen de varias formas. Una técnica consiste en es- 
cribir una expansión hacia adelante de la serie de Taylor alrededor 
de x;: 
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yA 
Fa FE, 
aA=y+fh+ ZA O 
y; 1 J: 2 6 
que también se escribe como: 
h , hp? ” 
dis = Y, +A HER METE q. (26.36) 
De la sección 4.1.3 recuerde que se puede usar una diferencia 
hacia atrás para aproximar la derivada: is 
i-1 Xx; x 
(a Lo ++ o() 0 
2 
que al sustituirse en la ecuación (26.36) da como resultado Figura 26.8 
Representación gráfica de las fórmulas de integración de 
e L f ne Newton-Cotes abierta y cerrada. a) La fórmula abierta de 
Yin ==) +A f, A q i h+0(h ) ed ++ tercer orden [ecuación (26.33)] y b) la regla de Simpson 1/3 
2 [ecuación (26.35)]. 
o, agrupando términos, 
3 1 5 ” 
du li es +0(h*) (26.37) 


Esta fórmula se conoce como la fórmula abierta de Adams de segundo orden. Las fórmulas 
abiertas de Adams también se denominan fórmulas de Adams-Bashforth. En consecuencia, la ecua- 
ción (26.37) se llama la segunda fórmula de Adams-Bashforth. 

Es posible desarrollar fórmulas de Adams-Bashforth de orden superior sustituyendo aproxima- 
ciones por diferencias superiores en la ecuación (26.36). La fórmula abierta de Adams de n-ésimo 
orden en forma general se representa como: 


n-1 
Yi = Y, HAD Bf +0(1"*") (26.38) 
k=0 


Los coeficientes f, se muestran en la tabla 26.1. La versión de cuarto orden se representa en la figu- 
ra 26.94. Observe que la versión de primer orden es el método de Euler. 


Fórmulas cerradas (de Adams-Moulton) Una serie de Taylor hacia atrás alrededor de x;, , se 
escribe como: 


ica 
2 3! 


Y Yi TL h+ h +... 
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Tabla 26.1 Coeficientes y error de truncamiento para los predictores de Adams-Bashforth. 


Error de 
Orden Bo Bs Ba Bs Ba Bs truncamiento local 
1 
1 1 HF 
> (E) 
5 pan 
2 3/2 -1/2 =HFUE) 
12 
3 23/12 16/12 5/12 EN 
251 seta) 
4 55/24 59/24 37/24 9/24 TA 
475 sets) 
5 1 901/720 =2 774/720 2 616/720 -1 274/720 251/720 TT FE) 
19087 ¿7 06) 
6 4 277/1720 =7 923/720 9 982/720 —7 298/720 2877/720 -475/720 60 280 PE) 
Al resolver para y; , se obtiene: 
2 
is yd Lat Late ” (26.39) 
Se puede usar una diferencia para aproximar la primera derivada: 
faÉ, E +1 
0 Lia > =2h+0(h”) 
que al sustituirse en la ecuación (26.39), y agrupando términos, 
da 
Mrs) E a O(h) 
2 2 12 
Esta fórmula se conoce como la fórmula cerrada de Adams de 
segundo orden o la segunda fórmula de Adams-Moulton. Obser- 
ve también que es la regla del trapecio. 
ee de Sl de el É La fórmula cerrada de Adams de n-ésimo orden generalmen- 
a te se escribe como: 
n-1 
2 Yi = Y HH Bi HO") 
k=0 
Los coeficientes $, se muestran en la tabla 26.2. El método de 
cuarto orden se ilustra en la figura 26.9b. 
Figura 26.9 
Sl Representación gráfica de las fórmulas de integración de Adams 
E Xx; x abierta y cerrada. a) La cuarta fórmula de Adams-Bashforth abierta 


y b) la cuarta fórmula de Adams-Moulton cerrada. 
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26.2.4 Métodos de pasos múltiples de orden superior 


Ahora que formalmente desarrollamos las fórmulas de integración de Newton-Cotes y de Adams, 
podemos utilizarlas para deducir métodos de pasos múltiples de orden superior. Como ocurrió con 
el método de Heun sin autoinicio, las fórmulas de integración se aplican conjuntamente como 
métodos predictor-corrector. Además, si las fórmulas abiertas y cerradas tienen errores de trun- 
camiento local del mismo orden, es posible incorporar modificadores del tipo que se presenta en 
la figura 26.5 para mejorar la exactitud y permitir el control del tamaño de paso. El cuadro 26.1 
ofrece ecuaciones generales para estos modificadores. En la siguiente sección presentamos dos de 
los procedimientos multipaso de orden superior más comunes: el método de Milne y el método 


de Adams de cuarto orden. 


Tabla 26.2 Coeficientes y error de truncamiento de los correctores de Adams-Moulton. 


Error de 
Orden Bo B; B, Bs Ba Bs truncamiento local 
2 1/2 1/2 o WEE) 
3 5/12 8/12 1/12 5 HFONE) 
4 9/24 19/24 -5/24 1/24 a PEE) 
27 HF 
5 251/720 646/720 -264/720 106/720 -19/720 a 
863 ¿726 
6 475/1 440 1 427/11 440 -798/1 440 482/1 440 -173/1 440 27/11 440 0 480 (É) 
Cuadro 26.1 Deducción de relaciones generales para modificadores 
La relación entre el valor verdadero, la aproximación y el error de 1,9, . . 
un predictor se representa en forma general como e 1,5,+1,5 Vía Yis1) (C26.1.4) 
Ep pre 


Un 
$ 


Pp 


Valor verdadero = Y + (C26.1.1) 


ESAS 
donde 7, y 0, = numerador y denominador, respectivamente, de la 
constante del error de truncamiento de un predictor, ya sea de Newton- 
Cotes abierto (tabla 21.4) o de Adams-Bashforth (tabla 26.1) y n es 
el orden. 

Se desarrolla una relación similar para el corrector: 


Valor verdadero = y”, A (C26.1.2) 
donde 7. y 0, = numerador y denominador, respectivamente, de la 
constante del error de truncamiento de un corrector, ya sea de Newton- 
Cotes cerrado (tabla 21.2) o de Adams-Moulton (tabla 26.2). Como 
en la deducción de la ecuación (26.24), la ecuación (C26.1.1) se resta 


de la ecuación (C26.1.2) para obtener 
o  7.+N HA 16 
y i+1 $ 


é 


Pp A €) 


0= y. (C26.1.3) 
Ahora, dividiendo la ecuación entre 7. + 9, 0./0,, multiplicando el 
último término por 0,/0,, y reordenando, se obtiene una estimación 
del error de truncamiento local del corrector: 


Para el modificador del predictor, la ecuación (C26.1.3) se despeja 
en el paso anterior: 


.Ó, 


9,0, +1,0, 


pryod(E)=- 0-15) 


que podrá sustituirse en el término del error de la ecuación (C26.1.1) 
para tener 


Ñ UA 
” 6 +n,6. 


ep pr0 


AS) (C26.1.5) 


Las ecuaciones (C26.1.4) y (C26.1.5) son versiones generales de 
modificadores que se utilizan para mejorar algoritmos de pasos 
múltiples. Por ejemplo, el método de Milne tiene y, = 14, 0, = 45, 
N.=1,0.=90. Sustituyendo estos valores en las ecuaciones (C26.1.4) 
y (C26.1.5) se obtienen las ecuaciones (26.43) y (26.42), respectiva- 
mente. Podrán desarrollarse modificadores similares para otros pares 
de fórmulas abiertas y cerradas que tengan errores de truncamiento 
local del mismo orden. 
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Método de Milne El método de Milne es el método de pasos múltiples más común, basado en 
las fórmulas de integración de Newton-Cotes. Este utiliza la fórmula abierta de Newton-Cotes de 
tres puntos como un predictor: 


m 4h m m m 
Yi Ya HS, =$ 21 +24 22) (26.40) 
y la fórmula cerrada de Newton-Cotes de tres puntos (regla de Simpson 1/3) como corrector: 
j m h m m ¡> 
Yi AAA: EN (26.41) 


donde ¡es un índice que representa el número de iteraciones del modificador. El predictor y los 
modificadores del corrector para el método de Milne se desarrollan a partir de las fórmulas del 
cuadro 26.1 y de los coeficientes del error en las tablas 21.2 y 21.4: 


E,=%67-y)) (26.42) 
E,=- L y a Ia (26.43) 
29 


EJEMPLO 26.5 Método de Milne 


Planteamiento del problema Con el método de Milne integre y” = 4e08* — 0,5y desde x = 0 
hasta x= 4 usando un tamaño de paso de 1. La condición inicial en x= 0, es y = 2. Como tratamos con 
un método de pasos múltiples se necesita de puntos previos. En una aplicación real, se usaría un mé- 
todo de un paso tal como un RK de cuarto orden para calcular los puntos requeridos. En este ejemplo, 
usaremos la solución analítica [recuerde la ecuación (E25.5.1) del ejemplo 25.5] obteniéndose los va- 
lores exactos para x,_3= 3, x,_2=-2 y x,_1 =-1 de y,_3 = -4.547302, y,_, =-2.306160 y y;_¡ = 
—0.3929953, respectivamente. 


Solución El predictor [ecuación (26.40)] se usa para calcular el valoren x= 1: 


411 
y” =-4.54730+ ro —1.99381+2(1.96067)]=6.02272  €,=2.8% 


El corrector [ecuación (26.41)] se emplea después para calcular 


y| =-0.3929953+ =0 99381 + 4(3)+5.890802] = 6.235210 €, = 0.66% 


Este resultado puede sustituirse en la ecuación (26.41) para corregir la estimación en forma iterativa. 
El proceso converge a un valor final corregido de 6.204855 (£,= 0.17%). 

Este valor es más exacto que la estimación de 6.360865 (€, = -2.68%) obtenida antes con el 
método de Heun sin autoinicio (los ejemplos 26.2 a 26.4). Los resultados en los siguientes pasos son 
yQ) = 14.86031 (e, =-0.11%), y(3) = 33.72426 (€, =-—0.14%) y y(4) = 75.43295 (e, = -0.12%). 


Como en el ejemplo anterior, el método de Milne generalmente da resultados de gran exactitud. 
Sin embargo, hay ciertos casos donde su desempeño es pobre (véase Ralston y Rabinowitz, 1978). 
Antes de examinar tales casos, describiremos otro procedimiento multipaso de orden superior: el 
método de Adams de cuarto orden. 


Método de Adams de cuarto orden Un método común de pasos múltiples basado en las 
fórmulas de integración de Adams utiliza la fórmula de Adams-Bashforth de cuarto orden (tabla 
26.1) como predictor: 


5 is O 
ñ Ñ + A z 
24 24h 24 Í-2 2710) 


Ya Y + al (26.44) 


26.2 Métodos de pasos múltiples 


y la fórmula de Adams-Moulton de cuarto orden (tabla 26.2) como corrector: 
; 9; 19 5 1 
Í =y"+h Ad E + de ) (26.45) 
Yi Y E ¿+1 El y TUE 
Los modificadores del predictor y del corrector para el método de Adams de cuarto orden se 


desarrollan a partir de las fórmulas del cuadro 26.1 y de los coeficientes de error en las tablas 26.1 
y 26.2 como sigue: 


251 4 
E == (yy (26.46) 
Pp 270 y;) 
19 
E =-—Qr —y (26.47) 
, 770 dirt 


EJEMPLO 26.6 Método de Adams de cuarto orden 


Planteamiento del problema Con el método de Adams de cuarto orden resuelva el mismo 
problema que en el ejemplo 26.5. 


Solución El predictor [ecuación (26.44)] se utiliza para calcular el valor en x= 1. 


553321 993814+>-1.960667- 26565228) =6.007539 
24 24 24 24 


y =2+1 ( 
e, =3.1% 


el cual es comparable al resultado que se obtiene usando el método de Milne, aunque menos exacto. 
El corrector [ecuación (26.45)] se emplea después para calcular 


y =2+1 [-25:398394+373-=71.993814+ 71960666 )> 6.253214 
24 247 24 24 
€, =-0.96% 


que también es comparable, aunque menos exacto que el resultado con el método de Milne. Este 
resultado se sustituye en la ecuación (26.45) para corregir de manera iterativa el estimado. El pro- 
ceso converge a un valor corregido final de 6.214424 (£,= 0.32%), que es un resultado exacto, pero 
también inferior al obtenido con el método de Milne. 


Estabilidad de los métodos de pasos múltiples La mejor exactitud del método de Milne 
mostrada en los ejemplos 26.5 y 26.6 podría anticiparse considerando los términos del error en los 
predictores [ecuaciones (26.42) y (26.46)] y en los correctores [ecuaciones (26.43) y (26.47)]. Los 
coeficientes para el método de Milne, 14/45 y 1/90, son más pequeños que los de Adams de cuarto 
orden, 251/720 y 19/720. Además, el método de Milne emplea menos evaluaciones de la función 
para alcanzar mejores estimaciones. Los anteriores resultados podrían llevarnos a la conclusión de 
que el método de Milne es superior y, por lo tanto, preferible a los de Adams de cuarto orden. Aunque 
esta conclusión se cumple en muchos casos, hay ocasiones en las que el método de Milne se desem- 
peña en forma inaceptable. Tal comportamiento se muestra en el siguiente ejemplo. 


EJEMPLO 26.7 Estabilidad de los métodos de Milne y de Adams de cuarto orden 


Planteamiento del problema Use los métodos de Milne y de Adams de cuarto orden para resol- 
ver 
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con la condición inicial x= 0, y = 1. Resuelva esta ecuación desde x = 0 hasta x = 10 usando un ta- 
maño de paso h = 0.5. Observe que la solución analítica es y = e”. 


Solución Los resultados, como se resumen en la figura 26.10, indican problemas con el método 
de Milne. Poco después del inicio de los cálculos, los errores empiezan a crecer y a oscilar en signo. 
En x = 10 el error relativo ha crecido a 2831% y el valor predicho mismo comienza a oscilar en 
signo. 

En cambio, los resultados con el método de Adams serán mucho más aceptables. Aunque el 
error también crezca, lo hará lentamente. Además, las discrepancias no mostrarán los violentos 
cambios de signo que muestra el método de Milne. 


Al inaceptable comportamiento manifestado por el método 
de Milne en el ejemplo anterior se le conoce como inestabilidad. 
yA Aunque no siempre ocurre, tal posibilidad nos lleva a la conclusión 


JE, de que deberá evitarse el procedimiento de Milne. Así, en general 
se prefiere el método de Adams de cuarto orden. 

_ La inestabilidad del método de Milne se debe al corrector. En 
consecuencia, se han realizado intentos para rectificar el defecto 
al desarrollar correctores estables. Una alternativa usada común- 

0.005 - TN p Ñ 
mente que emplea este procedimiento es el método de Hamming, 
el cual utiliza el predictor de Milne y un corrector estable: 

E 0 AO EA 
Yi A 

L 8 
que tiene un error de truncamiento local: 

_ Método de Milne 1 

235,0 
Solución verdadera E.= ¿Py 6) 
40 
F El método de Hamming también implica modificadores de la 
forma: 
ES E 9 
x m 0 
E, =0, -) 
3 
12, 0 
E,= 73719 =Yi+1) 
Figura 26.10 
Representación gráfica de la inestabilidad del método de El lector encontrará información adicional sobre éste y otros 
Milne. métodos de pasos múltiples en muchas fuentes (Hamming, 1973; 
Lapidus y Seinfield, 1971). 
PROBLEMAS 
26.1 Dada Si y(0) = 1, emplee el método de Euler implícito para obtener una 
dy solución de £=0 a 4, con un tamaño de paso de 0.4. 
e = 200 000y + 200 000e *—e* 26.3 Dadas 
a) Estime el tamaño de paso requerido para mantener la estabilidad dx =1999x, +2999x, 
con el uso del método de Euler explícito. di 
b) Si y(0) = 0, utilice el método de Euler implícito para obtener la dx, =-2000x, -3000x, 
solución desde f = 0 hasta 2, con un tamaño de paso de 0.1. t : 


26.2 Dado que Si x,(0) = x,(0) = 1, obtenga una solución de £= 0 a 0.2, con un ta- 


maño de paso de 0.05, con los métodos de Euler a) explícito y b) 


O eta A ña 
dt Ñ implícito. 


26.4 Resuelva el siguiente problema de valor inicial sobre el interva- 
loder=2a3: 
dy 


—=-0.4y+e 
dt d 
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Use el método de Heun sin autoinicio, con un tamaño de paso de 0.5 
y condiciones iniciales de y(1.5) = 5.800007 y yQ.0) = 4.762673. 
Itere el corrector hasta e, = 0.1%. Calcule los errores relativos ver- 
daderos porcentuales e, para sus resultados, con base en la solución 
analítica. 

26.5 Repita el problema 26.4, pero use el método de Adams de 
cuarto orden. [Observe que y(0.5) = 8.46909 y y(1.0) = 7.037566]. 
Itere el corrector hasta e, = 0.01%. 

26.6 Resuelva el problema siguiente de valor inicial, det=4 a 5: 


ey 
dt 1 


Use un tamaño de paso de 0.5 y valores iniciales de y(2.5) = 0.48, 
y(3) = 0.333333, y(3.5) = 0.244898, y y(4) = 0.1875. Obtenga sus 
soluciones con las técnicas siguientes: a) método de Heun sin auto- 
inicio (€,= 1%) y b) método de Adams de cuarto orden (€, = 0.01%). 
[Nota: las respuestas correctas que se obtienen de forma analítica son 
y(4.5) = 0.148148 y y(5) = 0.12.] Calcule los errores relativos por- 
centuales verdaderos e, de sus resultados. 

26.7 Resuelva el problema que sigue de valor inicial dex=0ax= 
0.75: 


ay 
dx 


Utilice el método de Heun sin autoinicio con tamaño de paso de 0.25. 
Si y(0) = 1, emplee el método de RK de cuarto orden con tamaño de 
paso de 0.25 para predecir el valor de inicio en y(0.25). 

26.8 Solucione el problema siguiente de valor inicial, de t=1.5a 
t=2,5 


=y -y 


dy_2y 
dt 1+t 


Use el método de Adams de cuarto orden. Emplee un tamaño de paso 
de 0.5 y el método de RK de cuarto orden para pronosticar los valo- 
res de inicio si y(0) = 2. 

26.9 Desarrolle un programa para el método de Euler implícito para 
una EDO lineal. Pruébelo con la repetición del problema 26.15. 
26.10 Desarrolle un programa para el método de Euler implícito para 
un par de EDO lineales. Pruébelo con la solución de la ecuación 
(26.6). 

26.11 Desarrolle un programa amigable para el usuario para el mé- 
todo de Heun sin autoinicio con modificador predictor. Emplee el 
método de RK de cuarto orden para calcular valores de inicio. Prue- 
be el programa con la repetición del ejemplo 26.4. 

26.12 Use el programa desarrollado en el problema 26.11 para re- 
solver el problema 26.7. 
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26.13 Considere la barra delgada de longitud / que se mueve en el 
plano x-y, como se ilustra en la figura P26.13. La barra se fija en uno 
de sus extremos con un perno y con una masa en el otro. Observe 
que g=9.81 m/s? y !=0.5 m. Este sistema se puede resolver usando: 


Sea 0 (0) =0 y 90) = 0.25 rad/s. Resuelva con cualquiera de los 
métodos que se estudiaron en este capítulo. Grafique el ángulo versus 
el tiempo, y la velocidad angular versus el tiempo. (Recomendación: 
descomponga la EDO de segundo orden.) 


Figura P26.13 


26.14 Dada la EDO de primer orden: 


Ed =-—700x —1000e* 
dt 


x(t=0)=4 


Resuelva esta ecuación diferencial rígida con algún método numéri- 
co, en el periodo O <= £ <= 5. También resuélvala en forma analítica y 
grafique las soluciones analítica y numérica tanto para la fase de 
transición rápida como lenta de la escala temporal. 

26.15 Se considera que la siguiente EDO de segundo orden es rígi- 
da: 


d 
22 10012 -1000y 
dx dx 
Resuelva esta ecuación diferencial en forma a) analítica y b) numé- 
rica, de x=0 a 5. Para el inciso b) utilice un enfoque implícito con 
h=0.5. Observe que las condiciones iniciales son y(0) = 1 y y(0) =0. 
Muestre los dos resultados gráficamente. 
26.16 Resuelva la ecuación diferencial siguiente, der=0a 1 

dy 

—=-10y 

dt ] 
con la condición inicial y(0) = 1. Use las técnicas siguientes para 
obtener sus soluciones: a) analítica, b) método de Euler explícito y 
c) método de Euler implícito. Para los incisos b) y c) use h =0.1 y 
0.2. Grafique sus resultados. 


Problemas de valores en la 
frontera y de valores propios 


De nuestro análisis al inicio de la parte siete, recuerde que una ecuación diferencial ordinaria se 
acompaña de condiciones auxiliares. Estas condiciones se utilizan para evaluar las constantes de 
integración que resultan durante la solución de la ecuación. Para una ecuación de n-ésimo orden, 
se requieren n condiciones. Si todas las condiciones se especifican para el mismo valor de la varia- 
ble independiente, entonces se trata de un problema de valor inicial (figura 27.1a). Hasta aquí, el 
material de la parte siete se ha dedicado a este tipo de problema. 

Hay otra aplicación en la cual las condiciones no se conocen para un solo punto, sino, más bien, 
se conocen en diferentes valores de la variable independiente. Debido a que estos valores se especi- 
fican en los puntos extremos o frontera de un sistema, se les conoce como problemas de valores en 
la frontera (figura 27.1b). Muchas aplicaciones importantes en ingeniería son de esta clase. En el 
presente capítulo analizamos dos procedimientos generales para obtener su solución: el método de 
disparo y la aproximación en diferencias finitas. Además, presentamos técnicas para abordar un tipo 
especial de problema de valores en la frontera: la determinación de valores propios (valores carac- 
terísticos o eigenvalores). Por supuesto, los valores propios también tienen muchas aplicaciones que 
van más allá de las relacionadas con los problemas de valores en la frontera. 


27.1 MÉTODOS GENERALES PARA PROBLEMAS DE VALORES 
EN LA FRONTERA 


Se puede utilizar la conservación de la energía para desarrollar 
un balance de calor para una barra larga y delgada (figura 27.2). 
Si la barra no está aislada en toda su longitud y el sistema se en- 


dy E Ñ az 
e = 410, yy, Ya) cuentra en estado estacionario, la ecuación resultante es 
dy, 2 
7 = LA, Y1 92) T 
E RÓS > +h(T,-T)=0 (27.1) 
donde en +=0, y, =)Y1.0Y Y2=)Y2,0 3d 
sl donde »” es un coeficiente de transferencia de calor (m?) que 
o y parametriza la velocidad con que se disipa el calor en el medio 
E ambiente, y T,, es la temperatura del medio ambiente (*C). 
Condiciones std a 
its Y Para obtener una solución de la ecuación (27.1) se deben tener 
S condiciones de frontera adecuadas. Un caso simple es aquel donde 
2,0 
0 A los valores de las temperaturas en los extremos de la barra se man- 
a) tienen fijos. Estos valores se expresan en forma matemática como 
dy 
==, y) 
e FG y 
donde enx=0,y=» 
cElLay= Condición 
y de frontera 
A Figura 27.1 
Ye Problemas de valor inicial contra problemas de valores en la fronte- 
Condición 


de frontera — y, 


0 


ra. a) Un problema de valor inicial donde todas las condiciones se 
especifican para el mismo valor de la variable independiente. b) Un 


E problema con valores en la frontera donde las condiciones se espe- 
b) cifican para diferentes valores de la variable independiente. 
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T(0)=7T, 
TU) =T, 


Con estas condiciones, la ecuación (27.1) se puede resolver de 
manera analítica usando el cálculo. Para una barra de 10 metros 
con T, = 20, 7, = 40, T, = 200 y h' = 0.01, la solución es 


T=73.4523€e** — 53.4523e%** +20 (27.2) 


En las siguientes secciones se resolverá el mismo problema usan- 
do procedimientos numéricos. 


27.1.1 El método de disparo 


El método de disparo se basa en convertir el problema de valor 
en la frontera en un problema de valor inicial equivalente. Poste- 
riormente se aplica un procedimiento de prueba y error para re- 
solver la versión del valor inicial. El método se ilustrará con un 
ejemplo. 


EJEMPLO 27.1 El método de disparo 


Planteamiento del problema Utilice el método de disparo 
para resolver la ecuación (27.1), para una barra de 10 metros, h' = 
0.01 m?, T,=20 y las condiciones de frontera 


T(0) =40 T(10) = 200 


Solución Usando el mismo procedimiento que se empleó para 
transformar la ecuación (PT7.2) en las ecuaciones (PT7.3) a 
(PT7.6), la ecuación diferencial de segundo orden se expresa como 
dos EDO de primer orden: 


Ae Z (E27.1.1) 
dx pe 
A (E27.1.2) 
dx 


Para resolver estas ecuaciones, se requiere un valor inicial 
para z. En el método de disparo, proponemos un valor inicial, 
digamos, z(0) = 10. La solución se obtiene integrando las ecuacio- 
nes (E27.1.1) y (E27.1.2) simultáneamente. Por ejemplo, utilizando 
un método RK de cuarto orden con un tamaño de paso de 2, ob- 
tenemos un valor en el extremo del intervalo, 7(10) = 168.3797 
(figura 27,3a), el cual difiere de la condición de frontera, 7(10) = 
200. Por lo tanto, debemos realizar otra suposición, z(0) = 20, y 
efectuar de nuevo el cálculo. Esta vez, se obtiene el resultado de 
T(10) = 285.8980 (figura 27.3b). 


Figura 27.3 
El método de disparo: a) el primer “disparo”, b) el segundo “disparo” 
y d) el “tiro” final exacto. 


T, A _ e A mo T, 
E DS A: ES 
Me 
x=0 w=L 
Figura 27.2 


Una barra uniforme no aislada colocada entre dos cuerpos 
de temperatura constante, pero diferente. En este caso, T, 
> DyTR>I. 


200 - 0 


b) 
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Ahora, como la EDO original es lineal, los valores 


z(0) = 10 T(10) = 168.3797 


z(0) =20 T(10) = 285.8980 


están relacionados linealmente. Así, pueden utilizarse para calcular el valor de z(0) que da 7(10) = 
200. Se emplea una fórmula de interpolación lineal [recuerde la ecuación (18.2)] para tal propósito: 
20-10 


z(0)=10+ (200 -168.3797) =12.6907 
285.8980—168.3797 


Este valor se utiliza después para determinar la solución correcta, como se ilustra en la figura 27.3c. 


Problemas no lineales de dos puntos Para problemas de valores en la frontera no lineales, la 
interpolación lineal o extrapolación por medio de dos puntos de solución no necesariamente dará 
como resultado una estimación exacta de la condición de frontera requerida para obtener una solución 
exacta. Una alternativa consiste en realizar tres aplicaciones del método de disparo y usar un poli- 
nomio de interpolación cuadrática para estimar la condición de frontera adecuada. No obstante, es 
poco probable que este procedimiento ofrezca la respuesta exacta, y se necesitarán iteraciones adi- 
cionales para llegar a la solución. 

Otro procedimiento para un problema no lineal implica reformularlo como un problema de 
raíces. Recuerde que la forma general de un problema de raíces consiste en encontrar el valor de x 
que haga la función f(x) = O. Ahora, usemos el ejemplo 27.1 para entender cómo se plantea en esta 
forma el método de disparo. 

Primero, reconocemos que la solución del par de ecuaciones diferenciales es también una “fun- 
ción”, en el sentido que suponemos una condición en el extremo izquierdo de la barra, z,, y la inte- 
gración nos da una predicción de la temperatura en el extremo derecho, Tp. Así, se considera la 
integración como: 


To =f(Zo) 


Es decir, la integración representa un proceso por medio del cual un supuesto de z, dará una predic- 
ción de T¡. Visto de esta manera, sabemos que lo que deseamos es el valor de z, que proporcione un 
valor específico de T;¿. S1, como en el ejemplo, deseamos T;¿, = 200, planteamos el problema como 
sigue: 


200 = (20) 


Llevando el 200, que es nuestro objetivo, al lado derecho de la ecuación, genera una nueva función, 
£(Zp), que representa la diferencia entre lo que tenemos, f(z,), y lo que buscamos, 200. 


8 (Zo) =f(Zo) — 200 


Si llevamos esta nueva función a cero, obtendremos la solución. El siguiente ejemplo ilustra el pro- 
cedimiento. 


EJEMPLO 27.2 El método de disparo para problemas no lineales 


Planteamiento del problema Aunque sirvió para nuestros propósitos plantear un problema 

sencillo de valor en la frontera, nuestro modelo para la barra en la ecuación (27.1) no fue muy rea- 

lista. Debido a que la barra perderá calor por mecanismos que son no lineales, como la radiación. 
Suponga que la siguiente EDO no lineal se utiliza para modelar la temperatura de la barra caliente: 


2 
a Dn rCz, TyY*=0 
dx 
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donde h” =5x 10”. Ahora, aunque todavía no es una muy buena 
representación de la transferencia del calor, esta ecuación es su- 
ficientemente clara para permitirnos ilustrar cómo se utiliza el 
método de disparo para resolver un problema de valor en la fron- 200 - 
tera no lineal de dos puntos. Las condiciones restantes del proble- 
ma son las que se especifican en el ejemplo 27.1. 


Lineal 


Ez 7 ; 100 
Solución La ecuación diferencial de segundo orden se expresa 


como dos EDO de primer orden: 


No lineal 
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dT _ A E e ¡ ¡de 
== 0 5 10 2 
dz ” 4 

po ea Figura 27.4 


El resultado de usar el método de disparo para resolver un 


Ahora, se integran estas ecuaciones usando cualquiera de los problema no lineal. 
métodos que se describen en los capítulos 25 y 26. Utilizamos la 
versión con tamaño de paso constante del método de RK de cuar- 
to orden del capítulo 25. Donde implementamos este procedimien- 
to como una función macro de Excel escrita en Visual BASIC. La función integró las ecuaciones 
partiendo de un valor inicial para z(0) y dio como resultado la temperatura en x= 10. La diferencia 
entre este valor y el objetivo de 200 se introdujo luego en una celda de la hoja de cálculo. El Solver 
de Excel se utilizó después para ajustar el valor de z(0) hasta que la diferencia fuera cero. 

El resultado se muestra en la figura 27.4 junto con el caso lineal original. Como se esperaba, el 
caso no lineal está más “curvado” que el modelo lineal. Lo anterior se debe al término a la cuarta 
potencia en la relación de la transferencia del calor. 


El método de disparo se vuelve difícil para ecuaciones de orden superior, donde la necesidad 
de suponer dos o más condiciones vuelve el procedimiento más difícil. Por tales razones, se dispo- 
ne de métodos alternativos que se describen a continuación. 


27.1.2 Métodos de diferencias finitas 


Las alternativas más comunes al método de disparo son los métodos por diferencias finitas, en las 
cuales, las diferencias divididas finitas sustituyen a las derivadas en la ecuación original. Así, una 
ecuación diferencial lineal se transforma en un conjunto de ecuaciones algebraicas simultáneas que 
pueden resolverse utilizando los métodos de la parte tres. 

En el caso de la figura 27.2, la aproximación en diferencias divididas finitas para la segunda 
derivada es (recuerde la figura 23.3) 


dT — Toa -2T, +T,_, 
de Ax? 


Esta aproximación se sustituye en la ecuación (27.1) para dar 


HT, -T,)=0 


Agrupando términos se tiene 


TT, +Q+HMAxSD)T,—T,,, =h'AxT, (27.3) 
Esta ecuación es válida para cada uno de los nodos interiores de la barra. Los nodos interiores pri- 
mero y último, T,_ , y T;, ¡, respectivamente, se especifican por las condiciones de frontera. Por lo 
tanto, el conjunto resultante de ecuaciones algebraicas lineales será tridiagonal. Como tal, se resuel- 
ve con los algoritmos eficientes de que se dispone para estos sistemas (sección 11.1). 
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EJEMPLO 27.3 Aproximación por diferencias finitas de problemas con valores 
en la frontera 


Planteamiento del problema Use el procedimiento por diferencias finitas para resolver el 
mismo problema que en el ejemplo 27.1. 


Solución Empleando los parámetros del ejemplo 27.1, se escribe la ecuación (27.3) para la barra 
mostrada en la figura 27,2. El empleo de cuatro nodos interiores con un segmento de longitud Ax = 2 
metros da como resultado las siguientes ecuaciones: 


2.04 -1 0 O TT] [408 
1 204 -1 0 [m5] |os 
o -1 20 1 [x[ os 
o 0  -1 204||7,| |2008 


de las cuales se obtienen 


(Ty"=L65.9698 93.7785 124.5382 159.4795] 


La tabla 27.1 ofrece una comparación entre la solución analítica [ecuación (27.2)] y las solucio- 
nes numéricas obtenidas en los ejemplos 27.1 y 27.3. Observe que hay algunas discrepancias entre 
las aproximaciones. En ambos métodos numéricos, los errores se reducen al disminuir sus respecti- 
vos tamaños de paso. Aunque las dos técnicas funcionan bien en el presente caso, se prefiere el 
procedimiento por diferencias finitas debido a la facilidad con la que se puede extender a casos más 
complicados. 

La condición de frontera fija (o Dirichlet) que se usó en el ejemplo anterior es sólo uno de varios 
tipos que se utilizan comúnmente en ingeniería y ciencia. Una alternativa común, que se llama condición 
de frontera Neumann, es el caso cuando la derivada está dada. 

Se puede usar el modelo de barra caliente para demostrar cómo se puede incorporar la condición 
de frontera derivada en el enfoque de diferencia finita, 

i d?T " 

= dE + (Too sl T) 
Sin embargo, en contraste con las discusiones previas, se recomendará una condición de frontera 
derivada en un extremo de la barra, 


Tabla 27.1 Comparación de la solución analítica exacta con los métodos 
de disparo y de diferencias finitas. 


Xx Verdadera Método de disparo Diferencias finitas 
0 40 40 40 
2 65.9518 65.9520 65.9698 
4 93.7478 93.7481 93.7785 
6 124.5036 124.5039 124.5382 
8 159.4534 159.4538 159.4795 
10 200 200 200 
dT 
(0) = T! 
dx e 


T(D)=T, 
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Así, se tiene una condición de frontera derivada en un extremo del dominio de la solución, y una 
condición de frontera fija en el otro extremo. 

Como se hizo en el ejemplo 27.3, la barra se divide en una serie de nodos y se aplica una versión 
de diferencias finitas de la ecuación diferencial [ecuación (27.3)] a cada nodo interior. Sin embargo, 
dado que su temperatura no está especificada, también se debe incluir el nodo del lado izquierdo. 
Escribiendo la ecuación (27.3) para este nodo se obtiene 


Pia RAAA Ti = RAS (27.3a) 


Observe que para esta ecuación se necesita un nodo imaginario (-1) ubicado a la izquierda del 
extremo de la barra. Aunque este punto exterior podría parecer una dificultad, en realidad sirve como 
el vehículo para incorporar al problema la condición de frontera derivada. Esto se hace representan- 
do la primera derivada en la dimensión x en (0) por la diferencia centrada 


dT  T¡-T; 
dx 2Ax 


donde se puede despejar 
dT 
T_¡ = Ti =2Ax=— 

dx 


Ahora se tiene una formula para T', que realmente refleja el impacto de la derivada. Se puede sus- 
tituir en la ecuación (27.3a) para obtener 


/ 2 / 2 dT 

Q+HXAxXSDT -—2T, =hH'Ax “Ts — a (27.3b) 
En consecuencia, se ha incorporado la derivada al balance. 

Un ejemplo común de la condición de frontera derivada es el caso en el que el extremo de la 
barra está aislado. En este caso, la derivada se ajusta a cero. Esta conclusión se deduce directamente 
de la ley de Fourier, que dice que el flujo de calor es directamente proporcional al gradiente de tem- 
peratura. Así, aislar una frontera significa que el flujo de calor (y en consecuencia el gradiente) debe 
ser Cero. 

Además de los métodos por diferencias finitas y de disparo, existen otras técnicas para resolver 
problemas con valores en la frontera. Algunas de éstas se describen en la parte ocho y comprenden 
soluciones en estado estacionario (capítulo 29) y transitorio (capítulo 30) de problemas con valores 
en la frontera en dos dimensiones, usando diferencias finitas y soluciones en estado estacionario de 
problemas unidimensionales con el método del elemento finito (capítulo 31). 


27.2 PROBLEMAS DE VALORES PROPIOS 


Los problemas de valores propios, o característicos o eigenvalores, constituyen una clase especial 
de problemas con valores en la frontera, que son comunes en el contexto de problemas de ingeniería 
que implican vibraciones, elasticidad y otros sistemas oscilantes. Además, se utilizan en una amplia 
variedad de contextos en ingeniería que van más allá de los problemas con valores en la frontera. 
Antes de describir los métodos numéricos para resolver estos problemas, revisaremos alguna infor- 
mación como antecedente. Ésta comprende el análisis de la importancia tanto matemática como 
ingenieril de los valores propios. 


27.2.1 Antecedentes matemáticos 


En la parte tres se estudiaron métodos para resolver sistemas de ecuaciones algebraicas lineales de 
la forma general 


AX) = (B] 


Tales sistemas se llaman no homogéneos debido a la presencia del vector (B] en el lado derecho de la 
igualdad. Si las ecuaciones que constituyen tal sistema son linealmente independientes (es decir, que 
tienen un determinante distinto de cero), tendrán una solución única. En otras palabras, existe un con- 
junto de valores x que satisface las ecuaciones. 
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En cambio, un sistema algebraico lineal homogéneo tiene la forma general: 
[A1(X) =0 


Aunque son posibles las soluciones no triviales (es decir, soluciones distintas a todas las x= 0) para 
tales sistemas, generalmente no son únicas. Más bien, las ecuaciones simultáneas establecen rela- 
ciones entre las x que se pueden satisfacer con diferentes combinaciones de valores. 

Los problemas de valores propios relacionados con la ingeniería tienen la forma general: 


(a —A)x, + apX) + cc + AyyX, =0 
4,¡X, + (47, —A)x + 00 + Ary X, =0 
Ani + An Xa une (A, —Á)YX,, > 0 


donde A es un parámetro desconocido llamado valor propio o característico o eigenvalor. Una so- 
lución (X] de este sistema se le conoce como vector propio (vector característico o eigenvector). El 
conjunto de ecuaciones anterior también se expresa de manera concisa como: 


[14] -4101] (3 =0 (27.4) 


La solución de la ecuación (27.4) depende de la determinación del valor de 4. Una manera de 
obtenerlo se basa en el hecho de que el determinante de la matriz [[4] —A[/]] debe ser igual a cero 
para que existan soluciones no triviales. La expansión del determinante será un polinomio en función 
de 4. Las raíces de este polinomio son los valores propios. En la siguiente sección se presentará un 
ejemplo de dicho procedimiento. 


27.2.2 Antecedentes físicos 


El sistema masa-resorte de la figura 27.5a es un ejemplo simple para ilustrar cómo se presentan los 
valores propios en los problemas físicos. También ayudará a entender algunos de los conceptos 
matemáticos presentados en la sección anterior. 

Para simplificar el análisis, suponga que en cada masa no actúan fuerzas externas o de amorti- 
guamiento. Además, considere que cada resorte tiene la misma longitud natural / y la misma constan- 
te de elasticidad k. Por último, suponga que el desplazamiento 
de cada resorte se mide en relación con su sistema coordenado 
local con un origen en la posición de equilibrio del resorte 


figura 27.5a). Bajo estas consideraciones, se emplea la segun- 
| Um] ( 
AS >» OS A da ley de Newton para desarrollar un balance de fuerzas para 
ad 3 , ¿ cada masa (recuerde la sección 12.4), 
0 x 
dx, 
m =-—kx, +Kk(x, —x,) 
1 dt? 1 2 1 
y 
dx 
b) m 2 =—k(x, —x,)-kx 
2 de 2: 1 2 
0 Ed O donde x, es el desplazamiento de la masa ¡ respecto de su po- 
sición de equilibrio (figura 27.5b). Estas ecuaciones se expre- 
Figura 27.5 dd ias 
Colocando las masas alejadas de su posición de equilibrio se dx, 
crean fuerzas en los resortes que, después de liberados, hacen e =k(2x, +x,)=0 (27.5a) 
oscilar las masas. Las posiciones de las masas se pueden referir 
a coordenadas locales con orígenes en sus respectivas posicio- e 
nes de equilibrio. m, 3 — k(x, -2x,)=0 (27.5b) 
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De la teoría de vibraciones, se conoce que las soluciones de la ecuación (27.5) pueden tomar la 
forma: 


x,= A, sen(wt) (27.6) 
donde A; = la amplitud de la vibración de la masa ¡ y w = la frecuencia de la vibración, que es 


igual a: 


0=% (27.7) 


donde 7, es el periodo. De la ecuación (27.6) se tiene que: 
x/=-A,0'sen (Ot) (27.8) 


Las ecuaciones (27.6) y (27.8) se sustituyen en las ecuaciones (27.5), y después de agrupar términos, 
se expresan como: 


2k k 
oa A,=0 (27.9a) 
Mm; m; 
e A, (A oa =0 (27.9b) 
m, ma, 


Una comparación entre las ecuaciones (27.9) y (27.4) indica que ahora la solución se redujo a un 
problema de valores propios. 


EJEMPLO 27.4 Valores propios y vectores propios para un sistema masa-resorte 


Planteamiento del problema Evalúe los valores propios y los vectores propios de la ecuación 
(27.9) en el caso donde m, = m,=40 kg y k= 200 N/m. 


Solución Sustituyendo los valores de los parámetros en las ecuaciones (27.9) se obtiene: 
(10—w3A, -54,=0 
SA, + (10-w34,=0 

El determinante de este sistema es [recuerde la ecuación (9.3)]: 
(03?-200?*+75=0 


que puede resolverse con la fórmula cuadrática para w?= 15 y 5 s?. Por lo tanto, las frecuencias de 
las vibraciones de las masas son w = 3.873 s”* y 2.236 s”, respectivamente. Estos valores se utilizan 
para determinar los periodos de las vibraciones con la ecuación (27.7). Para el primer periodo, T, = 
1.62 s; y para el segundo, 7, = 2.81 s. 

Como se estableció en la sección 27.2.1, no es posible obtener un conjunto único de valores 
para las incógnitas. Sin embargo, se pueden especificar relaciones entre éstas sustituyendo los 
valores propios en las ecuaciones. Por ejemplo, para el primero (w? = 15 s”), A, = A). Para el 
segundo (w?=5 87), A, =4». 

Este ejemplo proporciona información valiosa con respecto al comportamiento del sistema de 
la figura 27.5. Además de su periodo, sabemos que si el sistema está vibrando en el primer modo, la 
amplitud de la segunda masa será igual, pero de signo opuesto a la amplitud de la primera. Como se 
observa en la figura 27.6a, las masas vibran alejándose, y después acercándose de manera indefinida. 

En el segundo modo, las dos masas tienen igual amplitud todo el tiempo. Así, como se observa 
en la figura 27.6b, vibran hacia atrás y hacia adelante sincronizadas. Deberá observarse que la con- 
figuración de las amplitudes ofrece una guía para ajustar sus valores iniciales para alcanzar un 
movimiento puro en cualquiera de los dos modos. Cualquier otra configuración llevará a la super- 
posición de los modos de vibración (recuerde el capítulo 19). 
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Figura 27.6 


Principales modos de vibración de dos 
masas iguales unidas por tres resortes 
idénticos entre paredes fijas. 


(0, 0) 


(L, 0) 


a) 


Figura 27.7 


a) Barra delgada. b) Diagrama de cuerpo 


libre de la barra. 
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a) Primer modo b) Segundo modo 


27.2.3 Un problema de valores en la frontera 


Ahora que hemos estudiado los valores propios, volvemos al tipo de problemas que es el objeto de 
este capítulo: problemas con valores en la frontera para ecuaciones diferenciales ordinarias. La fi- 
gura 27.7 muestra un sistema físico que puede servir como un ejemplo para examinar este tipo de 
problemas. 
La curvatura de una columna delgada sujeta a una carga axial P se modela mediante 
dy M 
— == (27.10) 
dx" El 
donde d?y/dx? especifica la curvatura, M = momento de flexión, E = módulo de elasticidad e / = 
momento de inercia de la sección transversal con respecto a su eje. Considerando el diagrama de 
cuerpo libre de la figura 27.7b, es claro que el momento de flexión en x es M = 
—Py. Sustituyendo este valor en la ecuación (27.10) se obtiene: 


4 poy=0 (27.11) 
donde 

p”= E (27.12) 

El 

Para el sistema de la figura 27.7, sujeto a las condiciones de frontera 

y(0)=0 (27.13a) 

y(L)=0 (27.13b) 
la solución general de la ecuación (27.11) es: 

y = A senípx) + B cosípx) (27.14) 


b) 


donde A y B son las constantes esenciales y arbitrarias de la integración que 
serán evaluadas por medio de las condiciones de frontera. De acuerdo con la 
primera condición [ecuación (27.13a)], 


0=A sen(0) + B cos(0) 


Por lo tanto, concluimos que B =0. 
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Se tiene, de acuerdo con la segunda condición [ecuación 
(Q7.13b)1, 


0=A sení(pL) + B cos(pL) 


Pero, puesto que B = 0, entonces, A sen(pL) = 0. Como A =0 re- 
presenta una solución trivial, concluimos que sen(pL)=0. Para que 
esta igualdad se cumpla, 


pL=nxt paran=1,2,3,... 7 (27.15) 


Así, existe un número infinito de valores que satisfacen las con- 
diciones de frontera. De la ecuación (27.15) se despeja 


p =— paran=1,2,3,... (27.16) 


los cuales son los valores propios para la columna. 

La figura 27.8, que muestra la solución para los primeros 
cuatro valores propios, puede ofrecer una ilustración sobre el 
significado físico de los resultados. Cada valor propio correspon- 
de a una manera en la que la columna se dobla o pandea. Combi- 
nando las ecuaciones (27.12) y (27.16), se obtiene: 


_*mr El 
P 
Éstas se consideran cargas de pandeo, pues representan los nive- 
les a los cuales se mueve la columna a cada configuración de 
pandeo sucesivo. En un sentido práctico, usualmente el primer 
valor es el de interés, ya que, en general, las fallas ocurren cuan- 


do la columna se pandea primero. Así, una carga crítica se define 
como: 


P paran=1,2,3,... (27.17) 


2 
El 
pa 7 


que se conoce como fórmula de Euler. 


2 2 2 2 
P nd P= EZ P= == P= EZ 
an=1 bjn=2 c)jn=3 din=4 
Figura 27.8 


Los primeros cuatro valores propios de la barra delgada de 
la figura 27.7. 


EJEMPLO 27.5 Análisis de valores propios de una columna cargada axialmente 


Planteamiento del problema Una columna de madera cargada axialmente tiene las siguientes 
características: E= 10 x 10? Pa, /= 1.25 x 10? m' y L= 3 m. Determine los primeros ocho valores 


propios y las correspondientes cargas de pandeo. 


Solución Se utilizan las ecuaciones (27.16) y (27.17) para calcular 


n p, m? P, kN 

1 1.0472 137.078 
2 2.0944 548.311 
3 3.1416 1233.701 
4 4.1888 2 193.245 
5 5.2360 3426.946 
6 6.2832 4934.802 
7 7.3304 6716.814 
8 


8.3776 8772.982 


La carga crítica de pandeo es, por lo tanto, 137.078 kN. 
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Aunque las soluciones analíticas del tipo antes obtenido son útiles, a menudo es difícil o imposi- 
ble obtenerlas. Normalmente esto ocurre cuando se trata con sistemas complicados o con aquellos que 
tienen propiedades heterogéneas. En tales casos, los métodos numéricos del tipo que a continuación 
se describirán son la única alternativa práctica. 


27.2.4 El método del polinomio 


La ecuación (27.11) se puede resolver numéricamente sustituyendo la segunda derivada por una 
aproximación en diferencias divididas finitas centradas (figura 23.3), lo que da 


diri Y +)Y1 +py,=0 

2 
la cual se expresa como: 
Yi-1 2 Q—= hpy;+ y; =0 (27.18) 


Al escribir esta ecuación para una serie de nodos a lo largo del eje de la columna, se obtiene un 
sistema de ecuaciones homogéneo. Por ejemplo, si la columna se divide en cinco segmentos (es 
decir, cuatro nodos interiores), el resultado es: 


(2-H?p?) 1 0 0 y 
-1 (Q-hp?) -1 0 | 
á e 2-Hp?) al > =0 (27.19) 
0 0 =] a-i 


La expansión del determinante del sistema da un polinomio, cuyas raíces son los valores propios. 
Este procedimiento, llamado el método del polinomio, se aplica en el siguiente ejemplo. 


EJEMPLO 27.6 El método del polinomio 


Planteamiento del problema Emplee el método del polinomio para determinar los valores 
propios de la columna cargada axialmente del ejemplo 27.5, usando a) uno, b) dos, c) tres y d) cua- 
tro nodos interiores. 


Solución 
a) Al escribir la ecuación (27.18) para un nodo interior, se obtiene (h = 3/2) 
-(2 -2.25p?)y, =0 
Así, en este caso sencillo, el valor propio se analiza igualando el determinante con cero 
2-2.25p?=0 


obteniendo p = +0.9428, que es aproximadamente 10% menor que el valor exacto de 1.0472 
obtenido en el ejemplo 27.4. 
Para dos nodos interiores (h = 3/3), la ecuación (27.18) se escribe como 


Es h Ej 
ñ = 
1. (Q-p)D» 


La expansión del determinante da 


b 


= 


2-pP?-1=0 


de donde se obtiene p =+1 y +1.73205. De esta manera, el primer valor propio ahora es aproxi- 
madamente 4.5% menor, y se obtiene un segundo valor propio que es aproximadamente 17% 
menor. 

c) Para tres puntos interiores (h = 3/4), la ecuación (27.18) se escribe como: 
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2 0.5625 p” -1 0 Y 
-1 2-0.5625p” -1 y, =0 (E27.6.1) 
0 -1 2-0.5625p” | | y, 


El determinante se iguala a cero y se expande para dar: 
(2 - 0.5625p?) — 2(2 — 0.5625p?) =0 


Para que esta ecuación se satisfaga, 2 — 0.5625p? = 0 y 2 — 0.5625p? = «/2 . Por lo tanto, los 
primeros tres valores propios se determinan como: 


p==1.0205 le,| =2.5% 
p=+1.8856 le,| = 10% 
p=+2.4637 — |e|=22% 


d) Para cuatro puntos interiores (h = 3/5), el resultado es la ecuación (27.19) con 2 — 0.36p? sobre 
la diagonal. Igualando a cero el determinante y expandiéndolo, se tiene: 


(2 -0.36p?)'- 3(Q -0.36p?+1=0 
que se resuelve para los primeros cuatro valores propios 


p=+10301  Je|=1.6% 
p=:+19593  le|=6.5% 
p=x+2.6967 — le|=14% 
p=x*3.1702  |e|=24% 


La tabla 27.2, que resume los resultados de este ejemplo, ilustra algunos aspectos fundamenta- 
les del método polinomial. Conforme la segmentación se refina más, se determinan valores propios 
adicionales, y los valores previamente determinados se vuelven progresivamente más exactos. Así, 
el procedimiento es muy adecuado para los casos donde se requieren los valores propios. 


Tabla 27.2 Los resultados de aplicar el método del polinomio a una columna cargada 
axialmente. Los números entre paréntesis representan el valor absoluto del error 
relativo porcentual verdadero. 


Método del polinomio 


Valor propio Verdadero h=3/2 h =3/3 h=3/4 h=3/5 
1 1.0472 0.9428 1.0000 1.0205 1.0301 
(10%) (4.5%) (2.5%) (1.6%) 

2 2.0944 1.7321 1.8856 1.9593 
(21%) (10%) (65%) 

3 3.1416 2.4637 2.6967 
(22%) (14%) 

4 4.1888 3.1702 
(24%) 


: 


27.2.5 El método de potencias 


El método de potencias es un procedimiento iterativo que sirve para determinar el valor propio ma- 
yor. Con ligeras modificaciones, también puede ser útil para determinar los valores menor e inter- 
medio. Como ventaja adicional, el vector propio correspondiente se obtiene como parte del método. 


Determinación del valor propio mayor Para implementar el método de potencias, el sistema 
que se analiza debe expresarse en la forma: 


[AX] =4 (X) (27.20) 
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Como se ilustra en el siguiente ejemplo, la ecuación (27.20) es la base para una técnica de solución 
Iterativa que, finalmente, proporciona el valor propio mayor y su vector propio asociado. 


EJEMPLO 27.7 Método de potencias para el valor propio mayor 


Planteamiento del problema Con el método de potencias determine el valor propio mayor 
para el inciso c) del ejemplo 27.6. 


Solución Primero, el sistema se escribe en la forma de la ecuación (27.20), 


3.556x, — 1.778x, =4x; 
-1.778x, +3.556x, - 1.778x, =4x, 
1118 das 


Después, suponiendo que las x del lado izquierdo de la ecuación son iguales a 1, 


3.556(1) — 1.778(1) = 1.778 
-1.778(1) + 3.556(1) - 1.778(1) =0 
- 1.778(1) + 3.556(1) = 1.778 


Luego, el lado derecho se normaliza con 1.778 para hacer que el elemento mayor sea igual a: 


1.778 1 
O ¿=1.778%0 
1.778 1 


Así, la primera estimación del valor propio es 1.778. Esta iteración se expresa en forma matricial 


como: 
3.556 1.778 0 1 1.778 1 
-1.778 3.556 -1.778|31p=% O ¿=1.778%0 
0 -1.778 3.556 | |1 1.778 1 


La siguiente iteración consiste en multiplicar [4] por kh o 1 para dar: 


3.556 1.778 0 1 3.556 1 
-1.778 3.556 -1.778|30+=3-3.556;+=3.556 ¿—1 
0 -1.778 3.556 | |1 3.556 1 


Por lo tanto, el valor propio estimado en la segunda iteración es 3.556, que puede emplearse para 
determinar el error estimado 


a 


a 1.778 


| 100% = 50% 
3.556 


Luego, el proceso puede repetirse. 
Tercera iteración: 


3.556 1.778 0 1 5.334 0.75 
-1.778 3.556 -1.778|<-1)=3—7.1127=-—7.112% 1 
0 -1.778 3.556 1 5.334 0.75 
donde |e,| = 150% (que es alto debido al cambio de signo). 
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Cuarta iteración: 


3.556 1.778 0 0.75 4,445 0.714 
-1.778 3.556  -1.778 1 ¿=3 6.223 ¿=6.223 1 

0 -1.778 3.556 | |-0.75 4,445 0.714 
donde |e,| = 214% (de nuevo, muy alto debido al cambio de signo). 


Quinta iteración: 


3.556 1.778 0 0.714 4.317 0.708 
-1.778 3.556 1.778 1 =3 6.095 ¿=6.095 1 
0 -1.778 3.556 ||-0.714 4.317 0.708 


Así, el factor normalizado converge al valor de 6.070 (= 2.4637?) obtenido en el inciso c) del 
ejemplo 27.6. 


Tenga en cuenta que en algunas ocasiones el método de potencias convergerá al segundo valor 
propio más grande, en lugar de hacerlo al primero. James, Smith y Wolford (1985) presentan un caso 
así. Otros casos especiales se analizan en Fadeev y Fadeeva (1963). 


Determinación del valor propio menor. En ingeniería existen problemas donde nos interesa 
determinar el valor propio menor. Tal es el caso de la barra en la figura 27.7, donde el valor propio 
menor se utilizó para identificar una carga de pandeo crítica. Esto puede realizarse aplicando el 
método de potencias a la matriz inversa de [4]. En este caso, el método de potencias converge al 
valor mayor de 1/4 (en otras palabras, el valor menor de 4). 


EJEMPLO 27.8 Método de potencias para el valor propio menor 


Planteamiento del problema Emplee el método de potencias para determinar el valor propio 
menor en el inciso c) del ejemplo 27.6. 


Solución Después de dividir la ecuación (E27.6.1) entre h? (= 0.5625), se evalúa su matriz inver- 
sa Como: 
0.422 0.281 0.141 
[AJ' =|0.281 0.562 0.281 
0.141 0.281 0.422 


Usando el mismo formato del ejemplo 27.7, el método de potencias se aplica a esta matriz. 
Primera iteración: 


0.4222 0.281 0.141| [1 0.884 0.751 

0.281 0.562 0.281 |<1)=+31.124+=1.124% 1 

0.141 0.281 0.422||[1 0.884 0.751 
Segunda iteración: 

0.422 0.281 0.141| [0.751 0.704 0.715 

0.281 0.562 0.281 1 =30.984+=0.984< 1 

0.141 0.281 0.422 |[0.751 0.704 0.715 


donde |e,| = 14.6%. 
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Tercera iteración: 


0.422 0.281 0.141|[0.715 0.684 0.709 

0.281 0.562 0.281 1 p=30.964/=0.964% 1 

0.141 0.281 0.422|[0.715 0.684 0.709 
donde |e,| = 4%. 


Así, después de sólo tres iteraciones, el resultado converge al valor de 0.9602, que es el recíproco 
del valor propio menor, 1.0205 (= y1 / 0.9602), obtenido en el ejemplo 27.6c. 


Determinación de valores propios intermedios Después de encontrar el mayor de los va- 
lores propios, es posible determinar los siguientes más grandes reemplazando la matriz original 
por una que incluya sólo los valores propios restantes. El proceso de eliminar el valor propio mayor 
conocido se llama deflación. La técnica explicada aquí, el método de Hotelling, está diseñada para 
matrices simétricas. Esto es porque aprovecha la ortogonalidad de los vectores propios de tales 
matrices, los cuales se expresan como: 

LO O, = E q (27.21) 

1 parai=j 

donde los componentes del vector propio [X) se han normalizado de forma tal que (XP (X] = 1; es 
decir, que la suma de los cuadrados de los componentes sea igual a 1. Esto se puede llevar a cabo 
dividiendo cada uno de los elementos entre el factor normalizado 


n 


2 
Xo 


k=1 
Ahora, se calcula una nueva matriz [4], como: 
[4], = [4], 4,09), 007 (27.22) 


donde [4], = la matriz original y 4, = el valor propio mayor. Si el método de potencias se aplica a 
esta matriz, el proceso de iteración converge al segundo valor propio más grande, 4,. Para demos- 
trarlo, primero multiplicamos por el lado derecho a la ecuación (27.22) por (X) ,, 


[41,49 = [41,4), A AAA 
Considerando el principio de ortogonalidad, esta ecuación se transforma en: 
[A1, (4), = [41,49, A AO 


donde el lado derecho es igual a cero, de acuerdo con la ecuación (27.20). Así, [4],(43, = 0. En 
consecuencia, 4 =0 y (X) = [X], es una solución para [4],(X] =4(X]. En otras palabras, la matriz 
[4], tiene los valores propios 0, 1, A, ..., A,. El valor propio mayor A, se reemplazó con un 0 y, por 
lo tanto, el método de potencias convergerá al siguiente 4, más grande. 

El proceso anterior puede repetirse generando una nueva matriz [4],, etc. Aunque, en teoría, 
este proceso podría continuar para determinar los valores propios restantes, está limitado por el 
hecho de que en cada paso se arrastran los errores sobre los vectores propios. Por ello, solamente 
es útil para determinar algunos de los valores propios más altos. Aunque, de alguna manera, esto es 
una desventaja, se requiere precisamente esta información en muchos problemas de ingeniería. 


27.2.6 Otros métodos 


Existe una gran variedad de métodos alternativos para resolver problemas de valores propios. La 
mayoría se basa en un proceso de dos pasos. El primer paso consiste en transformar la matriz origi- 
nal en una forma más simple (por ejemplo, tridiagonal), que conserve todos los valores propios 
originales. Después, se usan métodos iterativos para determinar estos valores propios. 


27.3 EDO y valores propios con paquetes de software 


Muchos de esos procedimientos están diseñados para tipos especiales de matrices. En particular, 
varias técnicas se dedican a la solución de sistemas simétricos. Por ejemplo, el método de Jacobi 
transforma una matriz simétrica en una matriz diagonal, al eliminar de forma sistemática los térmi- 
nos que están fuera de la diagonal. Por desgracia, el método requiere un enorme número de operacio- 
nes, ya que la eliminación de cada elemento distinto de cero a menudo crea un nuevo valor distinto 
de cero en un elemento previamente anulado. A pesar de que se requiere muchísimo tiempo para 
eliminar todos los elementos distintos de cero fuera de la diagonal, finalmente la matriz tenderá hacia 
una forma diagonal. Así, el procedimiento es iterativo en el sentido de que se repite hasta que los 
términos que están fuera de la diagonal son “suficientemente” pequeños. 

El método de Given también implica transformar una matriz simétrica en una forma más simple. No 
obstante, a diferencia del método de Jacobi, la forma más simple es tridiagonal. Además, difiere en que 
los ceros creados en posiciones fuera de la diagonal se conservan. En consecuencia, es finito y, por lo 
tanto, más eficiente que el método de Jacobi. 

El método de Householder también transforma una matriz simétrica en una forma tridiagonal. 
Es un método finito más eficiente que el método de Given, debido a que reduce a cero todos los 
elementos, renglones y columnas que están colocados fuera de la diagonal. 

Una vez que se obtiene un sistema tridiagonal mediante el método de Given o de Householder, 
los pasos restantes buscan hallar los valores propios. Una forma directa para realizar esto es expan- 
dir el determinante. El resultado es una secuencia de polinomios que se pueden evaluar iterativa- 
mente para los valores propios. 

Además de las matrices simétricas, también existen técnicas que están disponibles cuando se 
requieren todos los valores propios de una matriz general. Éstas incluyen el método LR de Rutishau- 
ser y el método OR de Francis. Aunque este último es menos eficiente, a menudo es el método pre- 
ferido, ya que es más estable. De hecho, se considera como el mejor método de solución para 
propósitos generales. 

Por último, debemos recordar que las técnicas antes mencionadas de manera común se utilizan 
conjuntamente para aprovechar sus ventajas respectivas. Por ejemplo, los métodos de Given y de 
Householder también se aplican a sistemas no simétricos. El resultado no será tridiagonal, sino más 
bien un tipo especial llamado forma de Hessenberg. Un procedimiento es aprovechar la velocidad 
del método de Householder para transformar la matriz a esta forma y, después, usar el algoritmo 
estable QR para hallar los valores propios. Información adicional sobre éstos y otros temas relacio- 
nados con los valores propios se encuentra en Ralston y Rabinowitz (1978), Wilkinson (1965), Fadeev 
y Fadeeva (1963) y Householder (1953, 1964). Están disponibles códigos para computadora en dife- 
rentes fuentes, como Press y cols. (2007). Rice (1983) analiza los paquetes de software disponibles. 


27.3 EDO Y VALORES PROPIOS CON PAQUETES DE SOFTWARE 


Los paquetes de software tienen grandes capacidades para resolver EDO y determinar valores propios. 
En esta sección se explican algunas de las formas en que pueden aplicarse con tal propósito. 


27.3.1 Excel 


Las capacidades directas de Excel para resolver problemas de valores propios y EDO son limitadas. 
Sin embargo, si se realiza alguna programación (por ejemplo, macros), se puede combinar con las 
herramientas de visualización y optimización de Excel para implementar algunas aplicaciones inte- 
resantes. En la sección 28.1 se proporciona un ejemplo de cómo se utiliza el Solver de Excel para la 
estimación de parámetros de una EDO. 


27.3.2 MATLAB 


Como podría esperarse, el paquete estándar MATLAB tiene excelentes capacidades para determinar 
valores y vectores propios. Aunque también tiene funciones prediseñadas para resolver EDO. Las 
soluciones estándar de EDO incluyen dos funciones para implementar el método Runge-Kutta Fehl- 
berg con tamaño de paso adaptativo (recuerde la sección 25.5.2). Éstas son ODEZ23, la cual usa fórmu- 
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las de segundo y de tercer orden para alcanzar una exactitud media; y ODEA45, que emplea fórmulas 
de cuarto y de quinto orden para alcanzar una exactitud alta. El siguiente ejemplo ilustra la manera 
en que se utilizan para resolver un sistema de EDO. 


EJEMPLO 27.9 Uso de MATLAB para valores propios y EDO 


Planteamiento del problema Explore cómo se utiliza MATLAB para resolver el siguiente 
conjunto de EDO no lineales desde £ = 0 hasta 20: 

dx dy 

—=1.2x-—0.6x — =-0.8y +0.3 

di A 
donde x= 2 y y = 1 en 1=0. Como se verá en el siguiente capítulo (sección 28.2), tales ecuaciones 


se conocen como ecuaciones depredador-presa. 


Solución Antes de obtener una solución con MATLAB, usted debe usar un procesador de texto 
para crear un archivo M que contenga el lado derecho de las EDO. Este archivo M será después uti- 
lizado para la solución de la EDO [donde x = y(1) y y = y(Q)l: 


function yp = predprey (t, y) 
yp = [1.2*y(1)-0.6*y (1) *y (2);-0.8*y (2)+0.3*y (1) *y (2) 1; 


Guardamos este archivo M con el nombre: predprey.m. 
Después, inicie con MATLAB, e introduzca las siguientes instrucciones para especificar el 
intervalo de integración y las condiciones iniciales: 


>> tspan = [0,20]; 
>> y0=[2,11; 


Luego se pide la solución mediante 
>> [t,y]=ode23 ('predprey',tspan,y0); 


Esta instrucción resolverá entonces las ecuaciones diferenciales en predprey.m en el intervalo defi- 
nido por t span usando las condiciones iniciales encontradas en y0. Los resultados se despliegan 
tecleando simplemente 


>> plot (t,y) 


con lo cual se obtiene la figura 27.9. 
Además, también se puede generar una gráfica del estado fásico; es decir, una gráfica de las 
variables dependientes, una con respecto de la otra mediante 


>> plot (y(:,1),y(:,2)) 


con lo que se obtiene la figura 27.10. 
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Figura 27.9 Figura 27.10 


Solución del modelo depredador-presa Gráfica del estado fásico para el modelo 


con MATLAB. depredador-presa con MATLAB. 
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En MATLAB también se incluyen funciones diseñadas para sistemas rígidos, definidas por 
ODEI5S y ODE23S. Como se muestra en el siguiente ejemplo, éstas funcionan bien cuando fallan 
las funciones estándar. 


EJEMPLO 27.10 MATLAB para EDO rígidas 


Planteamiento del problema La ecuación de Van der Pol se puede escribir como: 
20 
de ? 


dy 
rs YY, Y 


Cuando el parámetro u es muy grande, el sistema se convierte progresivamente en rígido. Dadas 
las condiciones iniciales, y,(0) = y,(0) = 1, use MATLAB para resolver los dos casos siguientes. 


a) Para u= 1, utilice ODEA45 para resolver desde f = O hasta 20. 
b) Para u= 1000, utilice ODE23S para resolver desde £ = O hasta 3000. 


Solución 

a) Se crea un archivo M para tener las ecuaciones diferenciales 
function yp = vanderpol (t, y) 
yp= [y (2) ;1* (1-y (1)*2) *y (2) -y (1)]; 

Después, como en el ejemplo 27.9, se llama a ODE45, el resultado se grafica (figura 27.11) 
>> tspan=[0,20]1; 

>> y0=[1,1]; 

>> [t,y]=ode45('vanderpol',tspan,y0); 

>> plot (t,y(:,1)) 

b) Si se utiliza una solución estándar como ODEAS, para el caso rígido (u = 1000), fallará irre- 
mediablemente (inténtelo y vea qué sucede); sin embargo, ODE23S hace un trabajo eficiente. 
Cambie el nuevo valor de u en el archivo M, la solución se obtiene y se grafica (figura 27.12), 
>> tspan=[0,3000]; 
>> y0=[1,1];5 
>> [t,y]=ode23S('vanderpol',tspan, y0); 
>> plot (t,y(:,1)) 

Observe que esta solución tiene bordes más afilados que los del inciso a). Ésta es una manifes- 
tación visual para la “rigidez” de la solución. 
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Figura 27.11 Figura 27.12 
La ecuación de Van der Pol en la forma no rígida La ecuación de Van der Pol en la forma rígida 
resuelta con la función ODE45 de MATLAB. resuelta con la función ODE23S de MATLAB. 
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Para valores propios, las capacidades también son de una muy fácil aplicación. Recuerde que, 
en nuestro análisis de sistemas rígidos del capítulo 26, presentamos el sistema rígido definido por la 
ecuación (26.6). Tales EDO lineales se escriben como un problema de valores propios de la forma 


S-% 3 el 0) 
100 301-A lle, 
donde A y [e) = el valor propio y vector propio, respectivamente. 


MATLAB se puede emplear, entonces, para encontrar tanto los valores propios (d) como los 
vectores propios (v) con las sencillas instrucciones siguientes: 


>> a=[5 -3;-100 301]; 
>> [v,d]=eig(a) 


V = 
-0.9477 0.0101 
-0.3191 0.9999 

d = 
3.9899 0 


0 302.0101 


Así, vemos que los valores propios son muy diferentes en magnitud, lo cual es común en un sistema 
rígido. 

Los valores propios se interpretan reconociendo que la solución general de un sistema de EDO 
se puede representar como la suma de exponenciales. Por ejemplo, en este caso la solución tendrá la 
forma: 


3.98991 


-302.01011 
Y¡ =Cijl + Cie 


3.98991 


302. 
y, =C>¡l + Capel 02.0101+ 


donde c, = la parte de la condición inicial de y, correspondiente al ¡-ésimo valor propio. Debe obser- 
varse que las c pueden evaluarse a partir de las condiciones iniciales y de los vectores propios. 
Cualquier buen libro sobre ecuaciones diferenciales, como por ejemplo, el de Boyce y DiPrima 
(1992), le explicará cómo se puede realizar esto. 

Puesto que, en este caso, todos los valores propios son positivos (y, por lo tanto, negativos en la 
función exponencial), la solución consta de un conjunto de exponenciales en decaimiento. La que 
tiene el valor propio más grande (en este caso, 302.0101) determinará el tamaño de paso en caso de 
que utilice una técnica con solución explícita. 


27.3.3 Mathcad 


Mathcad tiene varias funciones diferentes que resuelven ecuaciones diferenciales y determinan va- 
lores propios y vectores propios. La técnica más básica que utiliza Mathcad para resolver sistemas 
de ecuaciones diferenciales de primer orden es un algoritmo de Runge-Kutta de tamaño fijo de 
paso, de cuarto orden. Esto lo da la función rkfixed. Aunque éste es un buen integrador para todo 
uso, no siempre es eficiente. Por lo tanto, Mathcad suministra Rkadapt, una versión con tamaño 
variable de paso de rkfixed. Es adecuado para funciones que cambian rápidamente en algunas re- 
giones y lentamente en otras. De igual manera, si usted sabe que su solución es una función continua, 
entonces puede encontrar que la función Mathcad Bulstoer trabaja bien. Ésta utiliza el método 
Bulirsch-Stoer, y a menudo es tanto eficiente como altamente exacto para funciones continuas. 

Las ecuaciones diferenciales rígidas constituyen el lado opuesto del espectro. Bajo estas condi- 
ciones, la función rkfixed puede ser muy ineficiente o inestable. Por lo tanto, Mathcad proporciona 
dos métodos especiales específicamente diseñados para manejar sistemas rígidos. Estas funciones 
se llaman Stiffb y Stiffr, y se basan en el método Bulirsch-Stoer modificado para sistemas rígidos 
y el método Rosenbrock. 

Como ejemplo, se usará Mathcad para resolver las siguientes ecuaciones diferenciales ordinarias 
(EDO) no lineales: 


27.3 EDO y valores propios con paquetes de software 


dy 

— =1.2y; —0.6 

de Y1 Y1Y2 
dy 

—2 = —0.8 0.3 

dí ya +6.3y1y2 


con las condiciones iniciales y, = 2 y y, = 1. Este sistema, llamado ecuaciones Lotka-Volterra, lo 
usan los ingenieros ambientalistas y los ecólogos para evaluar las interacciones de los depredadores 
(y) y su presa (y). 

Como en la figura 27.13, primero se usa el símbolo de definición para precisar el vector D(u, y) 
que contiene los lados derechos de las EDO para su introducción a rkfixed. Observe que y; y y, en 
las EDO se cambian a y, y y, para cumplir los requisitos de Mathcad. Además, se definen las con- 
diciones iniciales (y,), el límite de integración (tf) y el número de valores que se quieren generar 
(npts). Las soluciones para rkfixed con 200 pasos entre £ =0 y tf se almacenan en la matriz ysol. La 
solución se muestra esquemáticamente en la gráfica de la figura 27.13. 

En seguida se puede ilustrar cómo evalúa Mathcad los valores propios y los vectores propios. La 
función eigenvals(M) devuelve los valores propios de la matriz cuadrada M. La función eigenvecs(M) 
devuelve una matriz que contiene los vectores propios normalizados correspondientes a los vectores 
propios de M, mientras que eigenvec(M,e) devuelve el vector propio correspondiente al valor propio 
e. Se pueden ilustrar estas funciones para el sistema dado por [recuerde la ecuación (26.6)] 


dy 


=-5 3 
di y1U+3Y 
dy, 
— = 100y, — 301 
di Y1 Y 


Los resultados se muestran en la figura 27.14. Como los valores propios (aa) son de diferentes 
magnitudes, el sistema es rígido. Observe que bb contiene el vector propio específico asociado con 
el valor propio más pequeño. El resultado, cc, es una matriz que contiene ambos vectores propios 
como sus columnas. 


"mM Mathcad 


Mi File Edit View  Imsert Format Tools Symbolics Window Help 


ODE SOLVER 
Define ODE, initial conditions, and integration parameters: 
Díuy) := 1-2Y9 0.6 Yo Y, npts:=200 
0.8-y, + 0.3-Yp Y; . 


Generate solution: 


ysol := rkfixed(y0,0,t£npts,D) 


Decompose results for plot: 


E 
t:=ysol 00) 


yl i=yso 0? 
142) 


y2 :=y580 


Figura 27.13 
Pantalla Mathcad para resolver un sistema de EDO. 
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MI File Edit View Irsert Format Tools Symbalics Window. Help 


cc := elgenvecsímm) 


3 És 


0.0101 
-0,319088 — 0,999949 


Pantalla Mathcad para despejar los valores propios de un sistema de EDO. 
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'“' Mathcad 
EIGENVALUE ANALYSIS 
mm:= DS ] 
"(2100 301, 
aa:= eigenvals(mm) 
=| 3.989933 ' 
-1302.010067 
bb := eigenvecímm, 3.989933) 
_(0.947725 
ud lejoca! 
Figura 27.14 
PROBLEMAS 


27.1 El balance de calor de estado estacionario de una barra se re- 
presenta como: 


2 
0157 =0 


Obtenga una solución analítica para una barra de 10 m con 7(0) = 
240 y T(10) = 150. 

27.2 Use el método del disparo para resolver el problema 27.1. 
27.3 Use el enfoque de diferencias finitas con Ax = 1 para resolver 
el problema 27.1. 

27.4 Emplee el método del disparo para resolver 


Y 


2 

cs Es -2 E e y+x=0 

dx dx 

con las condiciones de frontera y(0) = 5 y yQ0) = 8. 

27.5 Resuelva el problema 27.4 con el enfoque de diferencias finitas 

con Ax= 2, 

27.6 Utilice el método del disparo para solucionar 
AT 3 4 

qa (T 4273 +4(150-T)=0 (P27.6.1) 

Obtenga una solución para las condiciones de frontera: 7(0) = 200 y 

T(0.5) = 100. 

27.7 Es frecuente que las ecuaciones diferenciales como la que se 

resolvió en el problema 27.6 se puedan simplificar si se linealizan 

los términos no lineales. Por ejemplo, para linealizar el término a la 

cuarta potencia de la ecuación (P27.6.1), se puede usar una expansión 

en series de Taylor de primer orden, así: 


1x 107 +273)'=1x 10 UT, + 273) +4 
«107, +27 7 -T) 


donde T, es la temperatura base acerca de la que se linealiza el térmi- 
no. Sustituya esta relación en la ecuación (P27.6.1) y luego resuelva 
la ecuación lineal resultante con el enfoque de diferencias finitas. 
Emplee 7, = 150 y Ax=0.01 para obtener su solución. 

27.8 Repita el ejemplo 27.4 pero para tres masas. Elabore una grá- 
fica como la de la figura 27.6 para identificar los principales modos 
de vibración. Cambie todas las k a 240. 

27.9 Vuelva a hacer el ejemplo 27.6, pero para cinco puntos interio- 
res (h = 3/6). 

27.10 Use menores para expandir el determinante de: 


2-4 8 10 


27.11 Emplee el método de potencias para determinar el valor 
propio más alto y el vector propio correspondiente, para el problema 
27.10. 

27.12 Emplee el método de potencias para determinar el valor 
propio más bajo y el vector propio correspondiente para el problema 
27.10. 

27.13 Desarrolle un programa de cómputo amigable para el usuario 
a fin de implantar el método del disparo para una EDO lineal de 
segundo orden. Pruebe el programa con la duplicación del ejemplo 
27.1. 


27.14 Utilice el programa que desarrolló en el problema 27.13 para 
resolver los problemas 27.2 y 27.4. 

27.15 Desarrolle un programa de computadora amigable para el 
usuario para implantar la aproximación de diferencias finitas para 
resolver una EDO lineal de segundo orden. Pruébelo con la duplica- 
ción del ejemplo 27.3. 

27.16 Utilice el programa desarrollado en el problema 27.15 para 
resolver los problemas 27.3 y 27.5. 

27.17 Desarrolle un programa amigable para el usuario para encon- 
trar el valor propio más alto con el método de la potencia. Pruébelo 
con la duplicación del ejemplo 27.7. 

27.18 Desarrolle un programa amigable para el usuario a fin de re- 
solver el valor propio más pequeño con el método de la potencia. 
Pruébelo con la duplicación del ejemplo 27.8. 

27.19 Emplee la herramienta Solver de Excel para solucionar direc- 
tamente (es decir, sin linealización) el problema 27.6 con el uso del 
enfoque de diferencias finitas. Emplee Ax = 0.1 para obtener su so- 
lución. 

27.20 Use MATLAB para integrar el siguiente par de EDO, de £=0 
a 100: 


e 


de =0.35y, —-1.6y,y, 


dy 
e =0.04y,y, —0.15y, 


donde y, = 1 y y, = 0.05 en £= 0. Desarrolle una gráfica de espacio 
fásico (es una gráfica de y, versus y, para £) de sus resultados. 
27.21 La ecuación diferencial que sigue se utilizó en la sección 8.4 
para analizar la vibración del amortiguador de un auto: 


2 
1251041100 + 15x10%x=0 
di di 


Transforme esta ecuación en un par de EDO. a) Use MATLAB para 
resolver las ecuaciones, de £= 0 a 0.4, para el caso en que x= 0.5, y 
dx/dt= 0 en t=0. b) Emplee MATLAB para determinar los valores 
y vectores propios para el sistema. 

27.22 Use MATLAB o Mathcad para integrar: 


dx de 

— =-0x+0 
di dá 
dy 

— =TFxX—y-xXx 
dt id E 
dz 

an —bz + xy 


donde O = 10, b=2.666667 y r= 28. Use condiciones iniciales de x 
=y=2=5, e integre desde £ = 0 hasta 20. 

27.23 Utilice diferencias finitas para resolver la ecuación diferencial 
ordinaria con valores en la frontera 


con condiciones de frontera u(0) = 10 y u(2) = 1. Grafique los resul- 
tados de u versus x. Utilice Ax = 0.1. 
27.24 Resuelva para la EDO no dimensionada, por medio del méto- 
do de diferencias finitas, que describa la distribución de la tempera- 
tura en una barra circular con fuente interna de calor S. 
dT 
RON + 
dr?  r dr 


en el rango 0 <= r <= 1, con las condiciones de frontera 
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dT 
=0 


T(r=1)=1 — = 
(r=1) ala 


para S= 1, 10 y 20 K/m?. Grafique la temperatura versus el radio. 
27.25 Obtenga el conjunto de ecuaciones diferenciales para un sis- 
tema de cuatro resortes y tres masas (figura P27.25) que describa su 
movimiento en el tiempo. Escriba las tres ecuaciones diferenciales 
en forma matricial. 


[vector de aceleración] + [matriz k/m] 
[vector de desplazamiento x] = 0 
Observe que cada ecuación ha sido dividida entre la masa. Resuelva 
para los valores propios y frecuencias naturales para los valores si- 


guientes de masa y constantes de elasticidad: k, = k¿= 15 N/m, k, = 
k¿=35 N/m, y m, = m, =m,=1.5 kg. 


— Xy E %3 
ka ko k Ka 
/ O os / 
! TT atar TIOTTO ETE GITIT A / 


TETITTTT 


Figura P27.25 


27.26 Considere el sistema masa-resorte que se ilustra en la figura 
P27.26. Las frecuencias para las vibraciones de la masa se determinan 
con la solución para los valores propios y con la aplicación de Mx + 
kx = 0, que da como resultado: 


m0 0 7(%] [2k —k -kl(x 
0 m 0 Kirk 2k kx, 
0 0 m]lx,) |-k -k 2k]|x, 


0 
=x30 
0 


Al elegir x= x,e"” como solución, se obtiene la matriz siguiente: 


2k-m,w =k =k ej 0 
=k 2k-m,0* =k Xp e” =30 
=k =k 2k—m,0? || xo, 0 


Utilice el comando ei g de MATLAB para resolver los valores pro- 
pios de la matriz anterior k — m(?, Después utilice dichos valores 


TIRA TRI ATA RARA TITIT AAA T TIRA AT, 


Figura P27.26 
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propios para resolver para las frecuencias ((). Haga m, = m, =m3= 
1 kg, y k=2 N/m. 
27.27 Hornbeck (1975) propuso la siguiente EDO parásita no lineal: 
2 sy 1) 
Si la condición inicial es y,(0) = 0.08, obtenga una solución de £=0 
aó: 
a) Analítica. 
b) Con el método de RK de cuarto orden con tamaño de paso 
constante de 0.03125. 
c) Con la función ODE45 de MATLAB. 
d) Con la función ODE23S de MATLAB. 
e) Con la función ODE23TB de MATLAB. 
Presente sus resultados en forma gráfica. 
27.28 Una barra caliente con una fuente de calor uniforme se puede 
modelar con la ecuación de Poisson: 
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Dada una fuente de calor fx) = 25 y las condiciones en la frontera 
T(x = 0) = 40 y T(x = 10) = 200, resuelva para la distribución de 
temperatura con a) el método del disparo y b) el método de diferen- 
cias finitas (Ax = 2). 

27.29 Repita el problema 27.28, pero para la siguiente fuente de 
calor: Ax) = 0.1217 - 2.47 + 12x. 

27.30 Suponga que la posición de un objeto que cae está gobernada 
por la siguiente ecuación diferencial: 


dx  cdx 0 
de md $ 

donde c = un coeficiente de arrastre de primer orden = 12.5 kg/s, m 
= masa = 70 kg y g = aceleración de la gravedad = 9.81 m/s? Use el 
método de disparo para despejar posición y velocidad de esta ecuación 
dadas las condiciones de frontera x(0) = 0 y x(12) = 500. 

27.31 Repita el ejemplo 27.3, pero aísle el lado izquierdo de la barra. 
Es decir, cambie las condiciones de frontera en el lado izquierdo de 
la barra a 7(0) =0. 


Estudio de casos: ecuaciones 
diferenciales ordinarias 


El propósito de este capítulo es resolver algunas ecuaciones diferenciales ordinarias usando los 
métodos numéricos presentados en la parte siete. Las ecuaciones provienen de problemas prácticos 
de la ingeniería. Muchas de estas aplicaciones generan ecuaciones diferenciales no lineales que no 
se pueden resolver con técnicas analíticas. Por lo tanto, usualmente se requieren métodos numéricos. 
Así, las técnicas para la solución numérica de ecuaciones diferenciales ordinarias son fundamenta- 
les en la práctica de la ingeniería. Los problemas de este capítulo ilustran algunas de las ventajas y 
desventajas de varios de los métodos desarrollados en la parte siete. 

La sección 28.1 plantea un problema en el contexto de la ingeniería química. Ahí se muestra 
cómo puede simularse el comportamiento transitorio de los reactores químicos. También se ilus- 
tra cómo utilizar la optimización para estimar los parámetros de las EDO. 

Las secciones 28.2 y 28.3 son tomadas de las ingenierías civil y eléctrica, respectivamente, y 
tratan con la solución de sistemas de ecuaciones diferenciales. En ambos casos, se necesita gran 
exactitud y, en consecuencia, se usa el método RK de cuarto orden. Además, el problema de inge- 
niería eléctrica implica también la determinación de valores propios. 

La sección 28.4 emplea varios métodos para investigar el comportamiento de un péndulo osci- 
lante. Este problema también utiliza un sistema de dos ecuaciones diferenciales simultáneas. Un 
aspecto importante de este ejemplo es que ilustra cómo los métodos numéricos permiten incorporar 
los efectos no lineales de manera fácil en un análisis de ingeniería. 


28.1 USO DE LAS EDO PARA ANALIZAR LA RESPUESTA TRANSITORIA 
DE UN REACTOR (INGENIERÍA QUÍMICA/BIOINGENIERÍA) 


Antecedentes En la sección 12.1 analizamos el estado estacionario de una serie de reactores. 
Además de los cálculos en estado estacionario, también podríamos estar interesados en la respuesta 
transitoria de un reactor completamente mezclado. Para ello, desarrollamos expresiones matemáticas 
para el término de acumulación de la ecuación (12.1). 

La acumulación representa el cambio de masa en el reactor por un cambio en el tiempo. En un 
sistema de volumen constante, esto se formula simplemente como 


Acumulación = ye (28.1) 
dt 
donde V = volumen y c = concentración. Así, una formulación matemática para la acumulación es 
el volumen por la derivada de c con respecto a £. 

En este problema incorporaremos el término acumulación en el balance de masa general que se 
desarrolló en la sección 12.1. Luego lo utilizaremos para simular la dinámica de un solo reactor y 
de un sistema de reactores. En el último caso, mostraremos cómo se pueden determinar los valores 
propios del sistema y analizaremos su dinámica. Por último, se ilustrará cómo se emplea la optimi- 
zación para estimar los parámetros de los modelos de balance de masa. 


Solución Las ecuaciones (28.1) y (12.1) se usan para representar el balance de masa de un solo 
reactor, como el que se muestra en la figura 28.1: 


y E - Dc... — Qc (28.2) 
dt 
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Acumulación = entradas — salidas 


La ecuación (28.2) se emplea para determinar soluciones 
transitorias, o variables en el tiempo, para el reactor. Por ejemplo, 


Qc sic =cC, en t=0, se utiliza el cálculo para obtener en forma 
—___ analítica la solución de la ecuación (28.2) 


Ef > 
cs 
) Si c,, = 50 mg/m”, O =5 m*/min, V= 100 m* y c, = 10 mg/m?, la 
solución es 
Figura 28.1 c=50(1 — 6995 + 100005 
Reactor completamente mezclado con un flujo de entrada : ! : 
y un flujo de salida. La figura 28.2 muestra esta solución analítica exacta. 


El método de Euler ofrece un procedimiento alternativo para 
resolver la ecuación (28.2). En la figura 28.2 se presentan dos solu- 
ciones con diferentes tamaños de paso. Conforme el tamaño de paso 

disminuye, la solución numérica converge a la solución analítica. Así, en este caso, el método numéri- 
co se utiliza para verificar el resultado analítico. 

Además de verificar los resultados dados en forma analítica, las técnicas numéricas son útiles en 
aquellas situaciones donde las soluciones analíticas son imposibles, o tan difíciles que resultan im- 
prácticas. Por ejemplo, más allá de un solo reactor, los métodos numéricos tienen utilidad para simu- 
lar la dinámica de sistemas de reactores. Por ejemplo, se pueden escribir EDO para los cinco reactores 
acoplados de la figura 12.3. El balance de masa para el primer reactor se puede escribir como 


de, 
v, dE = Qy1Cp1 + 0303 = Qy,C, = Q,sC, 


o, sustituyendo parámetros (observe que Q,,C,, 
20 m*, V, = 40 m?, V, = 80 m' y V, = 100 m>), 


= 50 mg/min, O = 160 mg/min, V, = 50 m', V, = 


03 Co 


dde 0d 
dt ” 


De manera similar, se desarrollan balances para los otros reactores como sigue 


50 + Euler, tamaño de paso = 10 
tamaño de paso = 5 


40 
le 

o 30 
E 
y 

20 

10 

0 ] ] | ] | > 
0 10 20 30 40 50 
t, min 
Figura 28.2 


Gráfica de las soluciones analítica y numérica de la ecuación (28.2). Las soluciones numéricas se obtie- 
nen con el método de Euler usando diferentes tamaños de paso. 


28.1 Uso de las EDO para analizar la respuesta transitoria de un reactor 


250 15c, -0.15c, 

dt : 

dc, 

5 =0.025c, -0.225c, +4 
di 

dc, 


+= 0.10, —0.1375c, +0.025c, 


E =0.03c, +0.01c, —0.04c, 


Suponga que en £= 0 todas las concentraciones en los reactores son cero. Calcule cómo aumen- 
tarán sus concentraciones en la siguiente hora. 

Las ecuaciones se integran con el método RK de cuarto orden para un sistema de ecuaciones, 
y los resultados se ilustran en la figura 28.3. Observe que cada uno de los reactores muestra una 
respuesta transitoria diferente a la entrada de la sustancia química. Esas respuestas se parametrizan 
mediante un tiempo de respuesta para 90%, 1,,, el cual mide el tiempo requerido por cada reactor 
para alcanzar 90% de su último nivel en estado estacionario. El intervalo de tiempos va desde cerca 
de 10 minutos en el reactor 3 hasta aproximadamente 70 minutos en el reactor 5. Los tiempos de res- 
puesta de los reactores 4 y 5 son de particular interés, ya que los dos flujos de salida del sistema salen 
de esos tanques. Así, un ingeniero químico que esté diseñando el sistema podrá cambiar los flujos 
o volúmenes de los reactores, para acelerar la respuesta de estos tanques manteniendo las salidas de- 
seadas. Los métodos numéricos del tipo que se describen en esta parte del libro son útiles para 
realizar estos cálculos de diseño. 

Una mejor comprensión de las características de respuesta del sistema se obtiene calculando sus 
valores propios. Primero, el sistema de EDO se escribe como un problema de valores propios: 


631 


Figura 28.3 


tiempo de respuesta para 90%, ?.,. 


Gráficas de respuesta transitoria o dinámica de la red de reac- 
tores de la figura 12.3. Observe que, con el tiempo, todos 

los reactores tienden a las concentraciones en estado esta- 
cionario previamente calculadas en la sección 12.1. Además, 
el tiempo hasta el estado estacionario se parametriza por el 
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0.12-4 


0 0.02 0 0 e, 
0.15-A 0 0 0 e, 

0.025 0.225-A 0 0 e, +=10) 
0 0.1. 0.1375-4 -0.025 | le, 
0.01 0 0 0.04-A| le, 


donde 4 y [e) = los valores propios y los vectores propios, respectivamente. 
Un paquete como MATLAB se utiliza para generar fácilmente los valores propios y los vecto- 


1.000 


>> a=[0.12 0.0 -0.02 0.0 0.0;-.15 0.15 0.0 0.0 0.0;0.0 
-0.025 0.225 0.0 0.0; 0.0 0.0 -.1 0.1375 -0.025; -0.03 -0.01 
0.0 0.0 0.04]; 


[e, 1]=eig (a) 


0 0 -0.1228 -0.1059 0.2490 
0 0 0.2983 0.5784 0.8444 
0 0 0.5637 0.3041 0.1771 
0 0.2484 0.7604 -0.7493 0.3675 
0 0.9687 0.0041 -0.0190  -0.2419 
0.1375 0 0 0 0 
0 0.0400 0 0 0 
0 0 0.2118 0 0 
0 0 0 0.1775 0 
0 0 0 0 0.1058 


Los valores propios se pueden interpretar reconociendo que la solución general de un sistema 


de EDO se representa como la suma de exponenciales. Por ejemplo, para el reactor 1, la solución 
general será de la forma 


e At hat ht hat Ast 
C¡=C,¡l +C,€ +C,€ +C,€ +C,,€ 


donde Es la parte de la condición inicial del reactor ¡ que corresponde al j-ésimo valor propio. Así, 
debido a que, en este caso, todos los valores propios son positivos (y, por lo tanto, negativos en la 
función exponencial), la solución consiste en un conjunto de exponenciales en decaimiento. Aquel 
con el valor propio menor (en nuestro caso, 0.04) será el más lento. En algunos casos, el ingeniero que 
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0.15 
0.03 
res propios. 
>> 
A Al a A 
t=0 t=1 t=2 t 
Tiempo o 12 8 
Concentración | cy | c, | c, |; 
Cc 
O 
O e, 


realiza este análisis podrá ser capaz de relacionar este valor propio con los parámetros 
del sistema. Por ejemplo, el cociente del flujo de salida del reactor 5 entre su volumen 
es (Q.. + O, /V. = 4/100 = 0.04. Tal información se utiliza, entonces, para modificar 
el desempeño de la dinámica del sistema. 

Por último quisiéramos revisar en el presente contexto la estimación del pará- 
metro. Donde a menudo se presenta lo anterior es en la cinética de reacción, es decir, 
la cuantificación de las velocidades de las reacciones químicas. 

Un sencillo ejemplo de esto se ilustra en la figura 28.4. Se tiene un conjunto de 
matraces que contienen un compuesto químico que decae con el tiempo. A ciertos 
intervalos de tiempo, se mide y se registra la concentración de uno de los matraces. 
Así, el resultado es una tabla de tiempos y concentraciones. 


Figura 28.4 
Un sencillo experimento para obtener datos de velocidad de un compuesto químico 
que decae con el tiempo (tomado de Chapra, 1997). 
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Un modelo comúnmente usado para describir tales datos es 
de 


= —kc" 
dt 


(28.3) 
donde k = una velocidad de la reacción y n = el orden de la reacción. Los ingenieros químicos utilizan 
datos de concentración contra tiempo como los que se presentan en la figura 28.4 para estimar k y n. 
Una manera de hacerlo es suponer valores de los parámetros y después resolver numéricamente la 
ecuación (28.3). Los valores pronosticados de concentración se comparan con las concentraciones 
medidas y se realiza la valoración del ajuste. Si el ajuste se considera inadecuado (por ejemplo, al 
examinar una gráfica o una medición estadística como la suma de los cuadrados de los residuos), los 
valores pronosticados se ajustan y se repite el procedimiento hasta que se alcanza un ajuste apropiado. 
Los siguientes datos se ajustan de la siguiente manera: 


td | 0 1 3 5 10 15 20 


c, mg/L 10.7 9 2.1 4.6 2.5 1.8 


La solución a este problema se muestra en la figura 28.5. Se utilizó una hoja de cálculo de Excel para 
realizar el cálculo. 
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A B C D E F G H 
1 | Ajuste de la velocidad de reacción 
2 | Datos con la integral/procedimiento de mínimos cuadrados 
3 k 0.091528 
4 1.044425 
5 1 
6 k1 k2 k3 k4 cm (cp-cm)42 
y) -1.22653 -1.16114 -1.16462 -1.10248 12 0 
8 -1.10261 -1.04409 -1.04719 -0.99157 10.83658 10.7 0.018653 
9 -0.99169 -0.93929 -0.94206 -0.89225 9.790448 
10 -0.89235 -0.84541 -0.84788 -0.80325 8.849344 9 0.022697 
11 -0.80334 -0.76127 -0.76347 -0.72346 8.002317 
-0.72354 -0.68582 -0.68779 -0.65191 7.239604 7,1 0.019489 
-0.65198 -0.61814 -0.61989 0.5877 6.552494 
-0.58776 -0.55739 -0.55895 -0.53005 5.933207 
-0.53011 -0.50283 -0.50424 -0.47828 5.374791 
-0.47833 -0.45383 -0.45508 -0.43175 4.871037 
0.4318 -0.40978 0.4109 -0.38993 4.416389 4.6 0.033713 
-0.38997 -0.37016 -0.37117 -0.35231 4.005877 
-0.35234 -0.33453 -0.33543 -0.31846 3.635053 
-0.31849 -0.30246 -0.30326 -0.28798 3.299934 
-0.28801 -0.27357 0.2743 -0.26054 2.996949 
-0.26056 -0.24756 -0.24821 -0.23581 2.1229 ZO 0.049684 
-0.23583 -0.22411 -0.22469 -0.21352 2.474917 
-0.21354 -0.20297 -0.20349 -0.19341 2.250426 
-0.19343 -0.18389 -0.18436 -0.17527 2.047117 
-0.17529 -0.16668 -0.16711 -0.1589 1.862914 
-0.15891 -0.15115 -0.15153 -0.14412 1.695953 1.8 0.010826 
SSR = 0.155062 


Figura 28.5 


Aplicación de una hoja de cálculo y de métodos numéricos para determinar el orden y el coeficiente de la velocidad de reacción 


con los datos. Esta tabla se obtuvo con la hoja de cálculo Excel. 
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Se introducen valores iniciales de la velocidad de reacción y 
del orden de reacción en las celdas B3 y B4, respectivamente, el 
tamaño de paso para el cálculo numérico se teclea en la celda 
BS. En este caso, se introduce una columna con el tiempo de los 
cálculos en la columna A, comenzando en O (celda A7) y termi- 
nando en 20 (celda A27). Los coeficientes desde k, hasta k, del 
método RK de cuarto orden se calculan en el bloque B7..E27. 
Éstos se usan ahora para determinar las predicciones de las con- 
centraciones (los valores C,) en la columna F. Los valores medidos 
(c, ) se introducen en la columna G adyacente a la columna de 

| | predicciones correspondientes, las cuales se utilizan después, 


Figura 28.6 


Gráfica del ajuste generado con el método de la integral/de 


mínimos cuadrados. 


10 20 1 conjuntamente, para calcular las diferencias elevadas al cuadrado 
en la columna H. Por último, estos valores se suman en la celda 
HA29. 

Aquí, el Solver de Excel se utiliza para determinar los mejores 
valores de los parámetros. Una vez que usted haya entrado al Solver, 
se le pide una celda objetivo o solución (H29); además se le pregun- 
ta si usted quiere maximizar o minimizar la celda objetivo (mini- 
mizar), y que dé las celdas que se van a variar (B3..B4). Después, 
usted activa el algoritmo [s(olve)], y los resultados son como los de 
la figura 28.5. Como se muestra, los valores de las celdas B3..B4 (k = 0.0915 y n= 1.044) minimizan 
la suma de los cuadrados de los residuales (SSR = 0.155) entre los datos de predicción y los datos me- 
didos. En la figura 28.6 se presenta una gráfica del ajuste junto con los datos. 


28.2 MODELOS DEPREDADOR-PRESA Y CAOS 
(INGENIERÍA CIVIL/AMBIENTAL) 


Antecedentes Los ingenieros ambientales modelan diversos problemas que implican sistemas 
de ecuaciones diferenciales ordinarias no lineales. En esta sección nos concentraremos en dos de 
estos problemas. El primero se relaciona con los modelos llamados depredador-presa, que se utilizan 
en el estudio de ciclos de nutrientes y contaminantes tóxicos en las cadenas alimenticias acuáticas, 
y de sistemas de tratamiento biológicos. El segundo son ecuaciones obtenidas de la dinámica de 
fluidos, que se utilizan para simular la atmósfera. Además de sus obvias aplicaciones en el pronós- 
tico del tiempo, tales ecuaciones también son útiles para estudiar la contaminación del aire y el 
cambio climático mundial. 

Los modelos depredador-presa se desarrollaron de manera independiente en la primera parte 
del siglo xx, gracias al trabajo del matemático italiano Vito Volterra y del biólogo estadounidense 
Alfred J. Lotka. Estas ecuaciones se conocen como las ecuaciones de Lotka-Volterra. El ejemplo 
más simple es el siguiente sistema de EDO: 


d. 

L = ax—bxy (28.4) 
dt 

dy = Cy + dxy 

dt (28.5) 


donde x y y = número de presas y depredadores, respectivamente, a = la razón de crecimiento de la 
presa, c = la razón de muerte del depredador, y b y d = la razón que caracteriza el efecto de la inter- 
acción depredador-presa sobre la muerte de la presa y el crecimiento del depredador, respectivamen- 
te. Los términos que se multiplican (es decir, los que involucran xy) hacen que las ecuaciones sean 
no lineales. 

Un ejemplo de un modelo sencillo basado en las dinámicas del fluido atmosférico son las ecua- 
ciones de Lorenz, desarrolladas por el meteorólogo estadounidense Edward Lorenz, 


1 ia 28.6 
di sá (28.6) 


28.2 Modelos depredador-presa y caos (ingeniería civil/lambiental) 


Figura 28.7 
Representación en el dominio del tiempo de los números de presas y depredadores con el modelo 
de Lotka-Volterra. 


Lo YX — Y — XZ (28.7) 
dt 
dz 
— =-bz+ 28.8 
4 Z + Xy (28.8) 


Lorenz desarrolló esas ecuaciones para relacionar la intensidad del movimiento de fluido atmosfé- 
rico, x, con las variaciones de temperatura y y z en las direcciones horizontal y vertical, respectiva- 
mente. Como en el modelo depredador-presa, observamos que la no linealidad está dada por los 
términos que se multiplican (xz y xy). 

Use métodos numéricos para obtener las soluciones de estas ecuaciones. Grafique los resultados 
para visualizar cómo las variables dependientes cambian en el tiempo. Además, grafique las varia- 
bles dependientes una contra otra para observar si surge algún patrón interesante. 


Solución Utilice los siguientes valores de los parámetros para la simulación depredador-presa: a = 
12, b=0.6, c =0.8 y d = 0.3. Emplee como condiciones iniciales x =2 y y = 1 e integre desde f =0 
hasta 30. Usaremos el método RK de cuarto orden con doble precisión para obtener las soluciones. 

En la figura 28.7 se muestran los resultados usando un tamaño de paso de 0.1. Advierta que 
surge un patrón cíclico. Así, como inicialmente la población del depredador es pequeña, la presa 
crece de manera exponencial. En cierto momento, las presas son 
tan numerosas que la población del depredador empieza a crecer. 
Después el aumento de depredadores causa que la presa disminu- 
ya. Esta disminución, a su vez, lleva a una disminución de los y 
depredadores. Con el tiempo, el proceso se repite. Observe que, 4 
como se esperaba, el pico en la curva para el depredador se retra- 
sa respecto al de la presa. Además, observe que el proceso tiene 
un periodo fijo; es decir, se repite cada cierto tiempo. 

Ahora, si se cambiaran los parámetros usados para simular 
la figura 28.7, aunque el patrón general seguirá siendo el mismo, 2 
las magnitudes de los picos, retrasos y periodos cambiarán. Así, 
existe un número infinito de ciclos que podrán ocurrir. 

Una representación del espacio-fase es útil para distinguir la 
estructura fundamental del modelo. En lugar de graficar x y y 
contra £, se grafica x contra y. Esta gráfica ilustra la manera en 0 | 


Punto 


7 crítico 
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que interactúan las variables de estado (x y y) y se le conoce como 0 2 
una representación del espacio-fase. 
En la figura 28.8 se muestra la representación estado-espacio Figura 28.8 


= 


del caso que estamos estudiando. La interacción entre el depre- Representación del espacio-fase del modelo Lotka-Volterra. 


dador y la presa define una órbita cerrada en sentido derecho. 
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-20 


Figura 28.9 


Representación en el dominio del tiempo de x contra t para las ecuaciones de Lorenz. La línea sólida 
para la serie del tiempo es para las condiciones iniciales (5, 5, 5). La línea punteada es cuando la condi- 
ción inicial para x está ligeramente perturbada (5.001, 5, 5). 


Observe que hay un punto crítico o de reposo en el centro de la órbita. La localización exacta de este 
punto se determina poniendo las ecuaciones (28.4) y (28.5) en estado estacionario (dy/dt = dx/dt = 0) y 
resolviendo para (x, y) = (0, 0) y (c/d, alb). La primera es el resultado trivial, si empezamos sin de- 


JA 
a) 25 
| 2 ES 
-20 20 x 
-25 
ZA 
b) 50 
| Ea 
-20 0 20 x 
Figura 28.10 


Representación del estado-fase de las ecuaciones de Lo- 
renz. a) Proyección xy; b) proyección xz. 


predador y sin presa, no sucederá nada. La segunda es el resulta- 
do más interesante si las condiciones iniciales se consideran como 
x =cld y y = alb, la derivada será cero y las poblaciones perma- 
necerán constantes. 

Ahora, utilicemos el mismo procedimiento para investigar el 
comportamiento de las ecuaciones de Lorenz con los siguientes 
valores de los parámetros: O = 10, b=2.666667 y r=28. Emplee 
como condiciones iniciales x= y = z= 5, e integre desde f = 0 
hasta 20. De nuevo, usaremos el método RK de cuarto orden con 
doble precisión para obtener las soluciones. 

Los resultados mostrados en la figura 28.9 son muy diferen- 
tes al comportamiento de las ecuaciones de Lotka-Volterra. La 
variable x parece experimentar un patrón casi aleatorio de osci- 
laciones, rebotando de valores negativos a positivos. Sin embargo, 
aun cuando los patrones parezcan aleatorios, la frecuencia de la 
oscilación y las amplitudes parecen bastante consistentes. 

Otra característica interesante se puede ilustrar cambiando 
ligeramente la condición inicial de x (de 5 a 5.001). Los resultados 
están superpuestos como una línea punteada en la figura 28.9. 
Aunque las soluciones siguen un mismo comportamiento por un 
tiempo, después de aproximadamente f= 12.5 divergen significa- 
tivamente. Así, se observa que las ecuaciones de Lorenz son muy 
sensibles a las condiciones iniciales. En su estudio original, esto 
llevó a Lorenz a la conclusión de que ¡pronosticar el clima a largo 
plazo será imposible! 

Por último, examinemos las gráficas del estado-fase. Como 
tenemos tres variables independientes, estamos limitados a pro- 
yecciones. En la figura 28.10 se muestran las proyecciones en los 
planos xy y xz. Observe que se manifiesta una estructura cuando 
la percibimos desde la perspectiva estado-fase. La solución forma 
órbitas alrededor de lo que parecen ser puntos críticos. Dichos 
puntos se llaman atractores extraños, en la jerga de los matemá- 
ticos que estudian tales sistemas no lineales. 

A las soluciones del tipo que hemos explorado en las ecua- 
ciones de Lorenz se les conoce como soluciones caóticas. Actual- 


28.3 Simulación de la corriente transitoria en un circuito eléctrico (ingeniería eléctrica) 


mente, el estudio del caos y de los sistemas no lineales representa una interesante área del análisis 
que tiene implicaciones tanto en las matemáticas como en la ciencia y en la ingeniería. 

Desde una perspectiva numérica, el punto principal es la sensibilidad de tales soluciones a las 
condiciones iniciales. Así, los diferentes algoritmos numéricos, la precisión de la computadora y la 
determinación del tamaño de paso tienen un impacto sobre la solución numérica que se obtenga. 


28.3 SIMULACIÓN DE LA CORRIENTE TRANSITORIA EN UN CIRCUITO 
ELÉCTRICO (INGENIERÍA ELÉCTRICA) 


Antecedentes Son comunes los circuitos eléctricos en los que la corriente varía con el tiempo, 
en lugar de permanecer constante. Cuando se cierra súbitamente el interruptor, se establece una 
corriente transitoria en el lado derecho del circuito que se muestra en la figura 28.11. 

Las ecuaciones que describen el comportamiento transitorio del circuito de la figura 28.11 se 
basan en las leyes de Kirchhoff, que establecen que la suma algebraica de las caídas de voltaje alre- 
dedor de un ciclo cerrado es cero (recuerde la sección 8.3). Así, 


Lino <0 (28.9) 
dt C 


donde L(di/dt) = la caída de voltaje a través del inductor, L = inductancia (H), R = resistencia (4), 
q = carga en el capacitor (C), C = capacitancia (F), E(t) = fuente de voltaje variable en el tiempo (V), e 


¡= 4 (28.10) 
dt 
Las ecuaciones (28.9) y (28.10) son un sistema de ecuaciones diferenciales lineales de primer orden 
que se pueden resolver analíticamente. Por ejemplo, si £(t) = E, sen wt y R=0, 


E, 


——5——- sen 0 (Q8.11) 
Lp? -0*) 


q(t)= o pt+ 
Lp?-0%) p 

donde p=1/YLC. Los valores de q y dq/dt son cero para £ = 0. Utilice un procedimiento numéri- 
co para resolver las ecuaciones (28.9) y (28.10), y compare los resultados con la ecuación (28.11). 


Solución Este problema comprende un intervalo de integración 
bastante amplio y requiere de un esquema de gran exactitud para 
resolver la ecuación diferencial, si se esperan buenos resultados. 
Supongamos que L=1 H, E, =1 V, C=0.25 C y w?=3.5 s”. Esto 


da p =2, y la ecuación (28.11) se convierte en Capacitor 
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q(1) =-1.8708 sen (21) + 2 sen (1.87081) 5% 


para la solución analítica. La gráfica de esta función se muestra 
en la figura 28.12. La naturaleza cambiante de la función exige 
necesariamente de un procedimiento numérico para encontrar 


Corriente 
o 
== | 
= 


El) 20L 


A) 


Interru poros -4.0 


Batería = VA ES: Capacitor Inductor 6.0 
+ + 0 20 40 


AN 


Resistor 


Figura 28.12 


100 


Figura 28.11 Pantalla de computadora donde se muestra la gráfica de la 


Circuito eléctrico donde la corriente varía con el tiempo. función obtenida en la ecuación (28.11). 
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Figura 28.13 


Resultados de la integración de Euler contra la 
solución exacta. Observe que sólo se grafica cada 


décimo punto de salida. 
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Carga 4 


4 Método de Euler 


q(t).. Además, como la función exhibe una naturaleza periódica que varía lentamente, así como una 
variación rápida, se necesitan intervalos de integración largos para encontrar la solución. Por estas 
razones se espera que un método de orden superior sea el adecuado para este problema. 

Sin embargo, podemos probar tanto el método de Euler como el RK de cuarto orden y comparar 
los resultados. Usando un tamaño de paso de 0.1 s, se obtiene un valor de q en £= 10 s de -6.638, 
con el método de Euler; y un valor de -1.9897, con el método RK de cuarto orden. Estos resultados 
se comparan con una solución exacta de -1.996 C. 

En la figura 28.13 se muestran los resultados de la integración de Euler cada 1.0 s comparada 
con la solución exacta. Observe que sólo se grafica cada décimo punto de salida. Note que el error 
global aumenta conforme £ aumenta. Este comportamiento divergente se intensifica conforme 1 se 
aproxima al infinito. 

Además, para simular directamente una respuesta transitoria de una red, los métodos numéricos 
también se utilizan para determinar sus valores propios. Por ejemplo, en la figura 28.14 se muestra 
un circuito LC para el cual puede emplearse la ley de voltaje de Kirchhoff para desarrollar el siguien- 
te sistema de EDO: 


di 1. 
a Pa L)di=0 


do pr. Le. 
L La ¿Le nara L,)dt=0 


2 dt E 
di lp lp 

e | di+—| 1) dt=0 
dt C, me C, 6 L,) 


Observe que hemos representado la caída de voltaje a través del capacitor como 


lp. 
Vo=GÍ dt 


Ésta es una expresión alternativa y equivalente a la relación usada en la ecuación (28.9), que se pre- 
sentó en la sección 8.3. 
El sistema de EDO se deriva y se reordena para llegar a 
L 1 L, £; 


Pi 1 
LA == 0 


AP 
dC ya 5) C; o C), O C; 
2 i d O Í, — mm —= l TT 
L l, de , , . . 0 


Figura 28.14 
i,)=0 Un circuito LC. 
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La comparación de este sistema con el de la ecuación (27.5) indica una analogía entre un siste- 
ma masa-resorte y un circuito LC. Como se hizo con la ecuación (27.5), la solución se considera de 
la forma 


l, = A, sen (wt) 


Esta solución, junto con su segunda derivada, se sustituye en las EDO simultáneas. Después de 
simplificar, el resultado es 


(h=20)a e =0 
1 C, 
En (e A, ee , ás 
1 C; C, 2 
1 1 
-—A, (he hue a =0 
C, C, 3 


Así, hemos formulado un problema de valores propios. Al hacer una simplificación se tiene el caso 
especial donde las C y las £ son constantes. En dicha situación, el sistema se expresa en forma ma- 
tricial como 


l=1A —1 0 Aj 
-1 2-2 -1 A> p =1(0) (28.12) 
0 Pr DA As 
donde 
4 =LCw? (28.13) 


Se pueden emplear métodos numéricos para determinar los valores y vectores propios. MATLAB 
resulta particularmente conveniente para este cálculo. Así, se desarrolló la siguiente sesión en 
MATLAB para realizar esto: 


>>a=[1 =1 07 -=1.2 =17?:0 1 21 


a = 
1 -1 0 
-1 2. -1 
0 -1 2 
>> [v,d]=eig (a) 
V = 
0.7370 0.5910 0.3280 
0.5910 -0.3280 -0.7370 
0.3280 -0.7370 0.5910 
d = 
0.1981 0 0 
0 1.5550 0 
0 0 3.2470 


La matriz v contiene los tres vectores propios del sistema (ordenados en columnas), y d es una 
matriz con los correspondientes valores propios en la diagonal. Así, en el paquete se calcula que los 
valores propios son: 4 = 0.1981, 1.555 y 3.247. Estos valores, a su vez, pueden sustituirse en la ecua- 
ción (28.13) para encontrar las frecuencias naturales del sistema 


0.4450 
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Figura 28.15 
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OT? PCTOTOT 2LEeToOrCcT 
a) 0. bp) 01240 0) u= 190 


Representación visual de los modos de oscilación naturales del circuito LC de la figura 28.14. 
Observe que los diámetros de las flechas circulares son proporcionales a las magnitudes de las corrientes en cada ciclo. 


Además de proporcionar las frecuencias naturales, los valores propios se sustituyen en la ecua- 
ción (28.12) para saber más acerca del comportamiento físico del circuito. Por ejemplo, sustituyendo 
4 =0.1981 se obtiene 


0.8019  —1 o Ti 
1. 18019 -1 Ki)=(0) 
0 1 1.8019 |li, 


Como este sistema no tiene una solución única, las corrientes están relacionadas de la siguiente 
manera 


0.8019, = i,=1.80194, (28.14) 


Así, como se ilustra en la figura 28.15a, oscilan en la misma dirección con diferentes magnitudes. 
Observe que si suponemos que i, = 0.737, entonces utilizamos la ecuación (28.14) para calcular el 
valor de las otras corrientes con el siguiente resultado: 


0.737 
[1)=40.591 
0.328 


que es la primera columna de la matriz v calculada con MATLAB. 
De manera similar, al sustituir el segundo valor propio 4 = 1.555, el resultado será 


-1.8018i, =i,=2.2471i, 


Como se ilustra en la figura 28.15b, el primer ciclo oscila en dirección opuesta respecto al segundo 
y al tercero. Por último, el tercer modo se determina como 


-0,445i, = i,=-0.8718i, 


En consecuencia, como se muestra en la figura 28.15c, el primero y el tercer ciclos oscilan en direc- 
ción opuesta al segundo. 


28.4 EL PÉNDULO OSCILANTE 
(INGENIERÍA MECÁNICA/AERONÁUTICA) 


Antecedentes Los ingenieros mecánicos (así como todos los otros ingenieros) a menudo enfren- 
tan problemas relacionados con el movimiento periódico de cuerpos libres. Para abordar tales pro- 
blemas se requiere conocer la posición y la velocidad de un cuerpo en función del tiempo. Tales 
funciones son invariablemente la solución de ecuaciones diferenciales ordinarias. Estas ecuaciones 
diferenciales se basan en las leyes del movimiento de Newton. 

Como ejemplo sencillo, considere el péndulo simple que se presentó en la figura PT7.1. La 
partícula de peso W está suspendida de un cable sin peso de longitud /. Las únicas fuerzas que actúan 
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sobre esta partícula son su peso y la tensión R en el cable. La posición de la partícula en cualquier 
instante está completamente especificada en términos del ángulo 0 y /. 

El diagrama de cuerpo libre de la figura 28.16 muestra las fuerzas que actúan sobre la partícu- 
la y la aceleración. Es conveniente aplicar las leyes del movimiento de Newton en la dirección x, 
tangente a la trayectoria de la partícula: 


SP Mino La 
g 
donde g = la constante gravitacional (32.2 ft/s?) y a = la aceleración en la dirección x. La aceleración 
angular de la partícula (a) es 


a 
0=-= 
l 


Por lo tanto, en coordenadas polares (a = d?0/df), 


2 
aj PEZ 
8 g dt 
0) 
2 
= + Fsen 9=0 (28.15) 


Esta ecuación aparentemente simple es una ecuación diferencial no lineal de segundo orden. En 
general, es difícil o imposible resolver tales ecuaciones de manera analítica. Usted tiene dos opciones 
para poder seguir adelante. Primero, reducir la ecuación diferencial a una forma que sea posible 
resolver analíticamente (recuerde la sección PT7.1.1) o, segundo, utilizar una técnica de aproximación 
numérica para resolver la ecuación diferencial de manera directa. Examinaremos ambas opciones 
en este ejemplo. 


Solución Procediendo con la primera opción, recordemos que la expansión en series de potencias 
para sen O está dada por 

o ey e 

sen0=0--——+ =7 


31 ST 2) + (28.16) 


Para desplazamientos angulares pequeños, sen O es aproximadamente igual a O cuando se expresa 
en radianes. Por lo tanto, para desplazamientos pequeños, la ecuación (28.15) se convierte en 


2 
20.850 (28.17) 
dt 1 


la cual es una ecuación diferencial lineal de segundo orden. Esta aproximación es muy importante, 
ya que la ecuación (28.17) es fácil de resolver analíticamente. La solución, basada en la teoría de las 
ecuaciones diferenciales, está dada por 


0(t) = O, cos JE (28.18) 


donde 6, = el desplazamiento en t= 0 y donde se supone que la velocidad (vu = d0/dt) es cero en t= 
0. Al tiempo requerido por el péndulo para un ciclo completo de oscilación se le llama periodo, y 
está dado por 


l 
T=2x |— (28.19) 
g 


En la figura 28.17 se muestra una gráfica del desplazamiento 0 y la velocidad d0/dt en función 
del tiempo, obtenidas a partir de la ecuación (28.18) con 0, = 7/4 y ! = 2 ft. El periodo, como se 
calculó con la ecuación (28.19), es 1.5659 s. 


641 


N o 
a 


0 


W 


Figura 28.16 
Diagrama de cuer- 
po libre del péndulo 
oscilante, donde se 
muestran las fuerzas 
sobre la partícula y la 
aceleración. 
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Figura 28.17 

Gráfica del desplazamiento 0 y la ve- 
locidad ad6/dt en función del tiempo t, 
como se calculó a partir de la ecuación 
(28.18). 6, es 1/4 y la longitud es de 2 ft. 


Los cálculos anteriores son, esencialmente, una solución completa del movimiento del péndulo. 
Sin embargo, usted debe considerar también la exactitud de los resultados debido a las suposiciones 
inherentes en la ecuación (28.17). Para evaluar la exactitud, es necesario obtener una solución nu- 
mérica de la ecuación (28.15), que es una representación física más completa del movimiento. Cual- 
quiera de los métodos analizados en los capítulos 25 y 26 podrán utilizarse con tal propósito (por 
ejemplo, los métodos de Euler y RK de cuarto orden). La ecuación (28.15) se debe transformar en 
un sistema de dos ecuaciones de primer orden para que sea compatible con los métodos anteriores. 
Esto se lleva a cabo de la siguiente manera. La velocidad v está definida por 


d 
d_, (28.20) 
dt 

y, por lo tanto, la ecuación (28.15) se expresa como 
d 
on 0 (28.21) 
dt l 


Las ecuaciones (28.20) y (28.21) constituyen un sistema de dos ecuaciones diferenciales ordinarias. Las 
soluciones numéricas utilizando los métodos de Euler y RK de cuarto orden dan los resultados que 
se muestran en la tabla 28.1, que son semejantes a la solución analítica de la ecuación lineal del 
movimiento [ecuación (28.18)] de la columna a), con las soluciones numéricas de las columnas b), c) 
y d). 

Los métodos de Euler y RK de cuarto orden dan resultados diferentes y ninguno de ellos con- 
cuerda con la solución analítica; aunque el método RK de cuarto orden en el caso no lineal es más 
cercano a la solución analítica que el método de Euler. Para evaluar adecuadamente la diferencia 
entre los modelos lineal y no lineal, es importante determinar la exactitud de los resultados numé- 
ricos. Esto se lleva a cabo de tres maneras. Primero, se reconoce fácilmente que la solución numérica 
de Euler es inadecuada debido a que sobrepasa la condición inicial en £= 0.8 s. Esto viola claramen- 
te la conservación de la energía. Segundo, las columnas c) y d) de la tabla 28.1 muestran la solución 
del método RK de cuarto orden con tamaños de paso 0.05 y 0.01. Como éstas varían en la cuarta 
cifra decimal, es razonable suponer que la solución con un tamaño de paso de 0.01 sea también 
exacta con este grado de certeza. Tercero, en el caso con tamaño de paso de 0.01, 6 tiene un valor 
máximo local de 0.785385 en t = 1.63 s (no mostrado en la tabla 28.1). Esto indica que el péndulo 
regresa a su posición original, con una exactitud de cuatro cifras, en un periodo de 1.63 s. Estas 
consideraciones le permiten suponer con seguridad que la diferencia entre las columnas a) y d) de 
la tabla 28.1 representa verdaderamente la diferencia entre el modelo lineal y el no lineal. 

Otra forma de caracterizar la diferencia entre el modelo lineal y el no lineal se basa en el perio- 
do. En la tabla 28.2 se indica el periodo de oscilación, como se calculó con los modelos lineal y no 
lineal para tres diferentes desplazamientos iniciales. Se aprecia que los periodos calculados concuer- 
dan bastante cuando 0 es pequeña, ya que 0 es una buena aproximación para sen 6 en la ecuación 
(28.16). Esta aproximación se deteriora cuando 6 se vuelve grande. 
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Tabla 28.1 Comparación de una solución analítica lineal del problema del péndulo oscilante, 


con tres soluciones numéricas no lineales. 


Soluciones numéricas no lineales 


Solución analítica Euler RK de cuarto orden RK de cuarto orden 
Tiempo, lineal (h = 0.05) (h = 0.05) (h = 0.01) 
s a) b) c) d) 

0.0 0.785398 0.785398 0.785398 0.785398 
0.2 0.545784 0.615453 0.566582 0.566579 
0.4 -0.026852 0.050228 0.021895 0.021882 
0.6 -0.583104 -0.639652 -0.535802 -0.535820 
0.8 -0.783562 -1.050679 -0.784236 -0.784242 
1.0 -0.505912 -0.940622 -0.595598 -0.595583 
1.2 0.080431 -0.299819 -0.065611 -0.065575 
1.4 0.617698 0.621700 0.503352 0.503392 

1.316795 0.780762 0.780777 


1.6 0.778062 


Tabla 28.2 Comparación del periodo de un cuerpo oscilante, calculado con los modelos lineal 


y no lineal. 


Periodo, s 


Desplazamiento Modelo lineal 


Modelo no lineal [solución numérica 


inicial, 6, (T=2x y1/ g) de la ecuación (28.15)] 
7/16 1.5659 1,57 
7/4 1.5659 1.63 
Tul2 1.5659 1.85 


Estos análisis son típicos de los casos que usted encontrará cotidianamente como ingeniero. La 
utilidad de las técnicas numéricas se vuelve particularmente importante en problemas no lineales y, 


en muchos casos, los problemas reales no son lineales. 


PROBLEMAS 


Ingeniería química/bioingeniería 

28.1 Ejecute el primer cálculo de la sección 28.1, pero para el caso 
en que h = 10. Para obtener soluciones utilice los métodos de Heun 
(sin iteración) y de RK de cuarto orden. 

28.2 Efectúe el segundo cálculo de la sección 28.1, pero para el 
sistema que se describe en el problema 12.4. 

28.3 Un balance de masa para un producto químico completamente 
mezclado en un reactor se escribe así 


vE-» ve 
dt 


donde V = volumen (12 m?), c = concentración (g/m*), F = tasa de 
alimentación (175 g/min), O = tasa de flujo (1 m*/min) y k = tasa 
de reacción de segundo orden (0.15 m*/g/min). Si c(0) = 0, resuelva 
la EDO hasta que la concentración alcance un nivel estable. Use el 
método del punto medio (h = 0.5) y grafique sus resultados. 

Pregunta adicional: Si se ignora el hecho de que las concentracio- 
nes deben ser positivas, encuentre un rango de condiciones iniciales 
de modo que se obtenga una trayectoria muy diferente de la que se 
obtuvo con c(0) = O. Relacione sus resultados con las soluciones de 
estado estable. 


28.4 Si c.,, =c,(1-e*”), calcule la concentración en el flujo de 
salida de una sustancia conservativa (no reactiva) para un reactor 
único mezclado completamente, como función del tiempo. Use el 
método de Heun (sin iteración) para efectuar el cálculo. Emplee 
valores de c, = 40 mg/m', O = 6 m'/min, V= 100 m* y c, = 20 mg/ 
m'. Haga el cálculo de £=0 a 100 min con h=2. Grafique sus resul- 
tados junto con la concentración del flujo de entrada versus el tiem- 
po. 
28.5 Se bombea agua de mar con una concentración de 8000 g/m? 
hacia un tanque bien mezclado, a una tasa de 0.6 m*/h. Debido al 
diseño defectuoso, el agua se evapora del tanque a una tasa de 0.025 
m'/h. La solución salina abandona el tanque a una tasa de 0.6 m*/h. 
a) Si originalmente el tanque contiene 1 m* de la solución que entra, 
¿cuánto tiempo después de que se enciende la bomba de salida 
quedará seco el tanque? 
b) Use métodos numéricos para determinar la concentración de sal 
en el tanque como función del tiempo. 
28.6 Un cubo de hielo esférico (una “esfera de hielo”) que mide 6 
cm de diámetro es retirada de un congelador a 0C y colocada en una 
pantalla de malla a temperatura ambiente T, = 20*C. ¿Cuál será el 
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diámetro del cubo de hielo como función del tiempo fuera del con- 
gelador (si se supone que toda el agua que se funde gotea de inme- 
diato a través de la pantalla)? El coeficiente de transferencia de calor 
h para una esfera en un cuarto tranquilo es alrededor de 3 W/(m? - K). 
El flujo calorífico de la esfera de hielo al aire está dado por 


: q 
Flujo ===H(T, -T 
105 (EE) 


donde q = calor y A = área superficial de la esfera. Use un método 
numérico para hacer el cálculo. Observe que el calor latente de la 
fusión es de 333 kJ/kg, y la densidad del hielo es aproximadamente 
de 0.917 kg/m'. 

28.7 Las ecuaciones siguientes definen la concentración de tres 
reactivos: 


d . 

Le = -10c,c,+C, 

dt 

d . 

“o = 10c,C,—C, 

dt 

d . 

Ce = =10c,c, +c, -2c, 

dt 


Si las condiciones iniciales son de c,= 50, c, =0 y c,=40, encuentre 
las concentraciones para los tiempos de 0 a 3 s. 

28.8 El compuesto A se difunde a través de un tubo de 4 cm de largo 
y reacciona conforme se difunde. La ecuación que gobierna la difu- 
sión con la reacción es 


2 
DESrAO 
dx 


En un extremo del tubo se encuentra una fuente grande de A con 
concentración de 0.1 M. En el otro extremo del tubo está un material 
que absorbe con rapidez cualquier A y hace que la concentración sea 
0M.SiD=1.5x 10% cm?/s y k=5 x 105”, ¿cuál es la concentra- 
ción de A como función de la distancia en el tubo? 

28.9 En la investigación de un homicidio o de una muerte accidental, 
con frecuencia es importante estimar el tiempo que ha transcurrido 
desde la muerte. De observaciones experimentales, se sabe que la 
temperatura superficial de un objeto cambia con una tasa proporcio- 
nal a la diferencia entre la temperatura del objeto y la del ambiente 
circundante, o temperatura ambiente. Esto se conoce como ley de 
Newton del enfriamiento. Así, si 7(1) es la temperatura del objeto al 
tiempo £, y T, es la temperatura ambiente constante: 


dT 
O q y 
en ( ) 


donde K'> 0 es una constante de proporcionalidad. Suponga que en 
el momento f = O se descubre un cuerpo y se mide su temperatura, 

T,, Se supone que en el momento de la muerte, la temperatura del 
cuerpo, T', era el valor normal de 37C. Suponga que la temperatura 
del cuerpo al ser descubierto era de 29.5*C, y que dos horas después 
era de 23.5”C. La temperatura ambiente es de 20*C. 

a) Determine K y el tiempo de la muerte. 

b) Resuelva la EDO en forma numérica y grafique los resultados. 
28.10 La reacción A > B tiene lugar en dos reactores en serie. Los 
reactores están bien mezclados pero no en estado estable. El balance 
de masa de estado no estable para cada tanque de agitado de los 
reactores es el siguiente: 
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Ez = (CA, CA,)-KCA, 
CB, +KCA, 

ea = (CA, CA,)—KkCA, 
= 2 = -(CB, CB,)—KkCA, 


donde CA, = concentración de A en la entrada del primer reactor, CA, 
= concentración de A a la salida del primer reactor (y en la entrada 
del segundo), CA, = concentración de A en la salida del segundo 
reactor. CB, = concentración de B en la salida del primer reactor (y 
en la entrada del segundo), CB, = concentración de B en el segundo 
reactor, T = tiempo de residencia de cada reactor y k= tasa constante 
para la reacción de A para producir B. Si CA, es igual a 20, encuentre 
las concentraciones de A y B en ambos reactores durante sus prime- 
ros 10 minutos de operación. Utilice k = 0.12/min y t = 5 min, y 
suponga que las condiciones iniciales de todas las variables depen- 
dientes son cero. 

28.11 Un reactor de procesamiento por lotes no isotérmico está 
descrito por las ecuaciones siguientes: 


d 

dC — ¿UTA 
dt 
ar 


> 10008 0259C _10(T -20) 


donde C es la concentración del reactante y T es la temperatura del 
reactor. Inicialmente, el reactor se encuentra a 15%C y tiene una con- 
centración de reactante C de 1.0 gmol/L. Encuentre la concentración 
y temperatura del reactor como función del tiempo. 

28.12 El sistema siguiente es un ejemplo clásico de EDO rígidas que 
ocurre en la solución de una reacción química cinética: 


d . 

“41 = -9.013c, —1 000c,c, 

di 

10 

dt 

de, 

mn = -0.013c, 1 000c,c, -2 500c,c, 


Resuelva las ecuaciones de += 0 a 50, con condiciones iniciales c,(0) 
=cC,(0)=1 y c,(0) =0. Si usted tiene acceso al software de MATLAB, 
use tanto la función estándar (por ejemplo, ode 45) como la rígida 
(por ejemplo, ode23s) para obtener sus soluciones. 
28.13 Una biopelícula con un espesor L, [cm] se desarrolla en la 
superficie de un sólido (figura P28.13). Después de atravesar una 
capa de espesor £ [cm], un compuesto químico A se difunde al inte- 
rior de la biopelícula donde está sujeta a una reacción irreversible de 
primer orden que lo convierte en un producto B. 

Se pueden usar balances de masa de estado estable para dedu- 
cir las siguientes ecuaciones diferenciales ordinarias para el com- 
puesto A: 


2 
Pes O<x<L 
dx? ES 
da? 
Dy a — kita =0 Lisa ELL 


Porción princi-— Capa de Superficie 
pal del líquido difusión Biopelícula sólida 

l 

1 
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l 
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l 
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l 
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l 

l 
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| 4 

x 
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Figura P28.13 
Una biopelícula desarrollándose sobre una superficie sólida. 


donde D = coeficiente de difusión en la capa de difusión = 0.8 cm?/d, 
D,= coeficiente de difusión de la biopelícula = 0.64 cm?/d y k =ra- 
pidez de primer orden para la conversión de A a B =0.1/d. Se man- 


tienen las siguientes condiciones de frontera: 


Ca = Cao enx=0 

dcCa 0 Dd 
T—= en x= 4 
dx Ei 


donde c,, = concentración de A en la porción principal del líquido = 
100 mol/L. Use el método de diferencia finita para calcular la distri- 
bución en estado estable de A desde x = O hasta L + L, donde L = 
0.008 cm y £,= 0.004 cm. Utilice diferencias finitas centradas con 
Ax=0.001cm. 

28.14 La siguiente ecuación diferencial describe la concentración 
en estado estable de una sustancia que reacciona con cinética de 
primer orden en un reactor de flujo pistón con dispersión axial (figu- 
ra P28.14). 

d?c de 

donde D = coeficiente de dispersión [m?/h], c= concentración [mol/L], 
x = distancia [m], U = velocidad diagonal [m/h] y k = rapidez de 
reacción [/h]. Las condiciones de frontera se pueden formular como 


dc 
UCen= Uc(x =0) - D—(x=0) 
dx 


de, L=0 
—ix = = 
dx 

—> a e —> 

—< > > —< > > 

—> 

—_—_—_—_to -————— a —— 

——> —_—_—_—— —— qáAÓA AS 

lo, 
x=0 x=L 


Figura P28.14 
Un reactor de flujo pistón con dispersión axial. 
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donde c,,,= concentración en flujo de entrada [mol/L] y L= longitud 
del reactor [m]. Estas condiciones se llaman condiciones de frontera 
Danckwerts. Use el método de diferencias finitas para despejar la 
concentración como función de la distancia dados los siguientes 
parámetros: D = 5000 m”/h, U= 100 m/h, k=2/h, L= 100 m y e... 
= 100 mol/L. Utilice aproximaciones por diferencias finitas centradas 
con Ax = 10 m para obtener sus soluciones. Compare sus resultados 
numéricos con la solución analítica, 


ay Ucen: 
“(U-=Dipimerl —(U -— Dio) ent 


Xx (erat A A 


donde 
Ai U 4kD 
==>—!|ll=+=,/1+ > 
A 2D a U? ) 


28.15 Una serie de reacciones de primer orden en fase líquida gene- 
ra un producto deseable (B) y un producto indeseable (C): 


aABBB2c 


Si las reacciones tienen lugar en un reactor de flujo pistón con dis- 
persión axial (figura P28.14), se pueden usar balances de masa de 
estado estable para desarrollar las siguientes EDO de segundo orden: 


Be, dCa 
=U— —k¡c,¿=0 
dx? dx 10% 
A 
C Cp = 
q? da 1Ca — K2Cp 
de. dC. 
=U kocp =0 
dx? dx + eco 


Use el método de diferencias finitas para despejar la concentración 
de cada reactante como función de la distancia, dados: D = 0.1 m?/ 
min, U=1 m/min, k,= 3/min, Kk, = 1/min, L=0.5 m, Caen = 10 mol/L. 
Utilice aproximaciones por diferencias finitas centradas con Ax = 
0.05 m para obtener sus soluciones y suponga condiciones de fron- 
tera Danckwerts como se describen en el problema 28.14. También 
calcule la suma de los reactantes como función de la distancia. ¿Tie- 
nen sentido sus resultados? 

28.16 En un reactor por cargas se desarrollan bacterias que utilizan 
una fuente soluble de alimentación (sustrato) como se describe en la 
figura P28.16. La ingestión del sustrato se representa por un modelo 
logístico con limitación Michaelis-Menten. La muerte de las bacterias 
produce detritus que luego se convierte en sustrato por hidrólisis. 
Además, las bacterias también excretan directamente algo de sustra- 


hidrólisis 
excreción 
Sustrato reincorpo- Bacterias muerte Detritus 
>] as | 
Ss ración Xx C 


Figura P283.16 
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to. La muerte, la hidrólisis y la excreción se simulan como reacciones 
de primer orden. 
Los balances de masa se pueden escribir como 


dX XxX S 
—7 = Hmáx | 1 X —k¿X — k¿X 
dt K Ks+58 


ac 

OE 

di d ) 

ds X S 
O E OTI E ea) Y PA 
di ar tá e) 


donde X, C y S = concentraciones [mg/L] de bacterias, detritus y 
sustrato, respectivamente; 4, = máxima tasa de crecimiento [/d], 
K = capacidad logística de transporte [mg/L]; K_= constante de 
media saturación Michaelis-Menten [mg/L], k, =tasa de mortalidad 
[/d]; k, = tasa de excreción [/d] y k, = tasa de hidrólisis [/d]. Simule 
las concentraciones desde f = O hasta 100 d, dadas las condiciones 
iniciales X(0) = 1 mg/L, S(0) = 100 mg/L y C(0) = 0 mg/L. Utilice 
los siguientes parámetros en su cálculo: y, =10/d, K= 10 mg/L, 
K =10 mg/L, k,=0.1/d, k, =0.1/d y k, =0.1/d. 


Ingeniería civil/ambiental 
28.17 Ejecute el mismo cálculo para el sistema de Lotka-Volterra 
de la sección 28.2, pero utilice el método de a) Euler, b) Heun (sin 
iterar el corrector), c) RK de cuarto orden y d) la función ode 45 
de MATLAB. En todos los casos use variables de precisión sencilla, 
tamaño de paso de 0.1, y simule de £= 0 a 20. Elabore gráficas de 
espacio-fase para todos los casos. 
28.18 Ejecute el mismo cálculo para las ecuaciones de Lorenz de la 
sección 28.2, pero use el método de a) Euler, b) Heun (sin iterar el 
corrector), c) RK de cuarto orden y d) la función ode 45 de MATLAB. 
En todos los casos emplee variables de precisión sencilla y un tama- 
ño de paso de 0.1 y simule de 1=0 a 20. Para todos los casos desa- 
rrolle gráficas de espacio-fase. 
28.19 La ecuación siguiente se utiliza para modelar la deflexión del 
mástil de un bote sujeto a la fuerza del viento: 

dy f 2 

2 ma 
donde f= fuerza del viento, E = módulo de elasticidad, £ = longitud 
del mástil e / = momento de inercia. Calcule la deflexión si y = 0 y 
dy/dz = 0 en z = 0. Para su cálculo utilice valores de parámetro de 
f=60, L=30, E=1.25 x 10% e /=0.05. 
28.20 Efectúe el mismo cálculo que en el problema 28.19, pero en vez 
de usar una fuerza del viento constante, emplee una fuerza que varíe 
con la altura de acuerdo con la ecuación (recuerde la sección 24.2) 


200z ¿2130 
S+2 


Ha) = 


28.21 Un ingeniero ambiental está interesado en estimar la mezcla 
que ocurre entre un lago estratificado y una bahía adyacente (véase la 
figura P28.21). Un trazador conservativo se mezcla instantáneamente 
con el agua de la bahía y después se monitorea la concentración del 
trazador durante el periodo que se muestra a continuación en los tres 
segmentos. Los valores son 


t 0 2 4 6 8 12 16 20 
c, 0 15 11 7 6 3 2 1 
E, 0 3 5 7 7 6 4 2 

00. 48 26 16 10 4 3 2 
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Capa 7] 


Bahía superior 
<| 1 
(3) (1) 
Y 
Capa 
inferior 
(2) 


Figura P23.21 


Con el empleo de balances de masa, el sistema puede modelarse con 
las EDO simultáneas siguientes: 


de 

y, y =-Qc, +E,,(c, =C,)+E,,(c,=C,) 
dc, 

v, e = Ey,(c, —C,) 
de 

Vi Ent - Cy) 


donde V, = volumen del segmento i, Q = flujo y E, = la tasa de mez- 
cla difusiva entre los segmentos i y j. Utilice los datos y las ecuacio- 
nes diferenciales para estimar las E si V, =1x 107, V, =8 x 10%, 
V,=5x10' y QO=4 x 10%. Para su análisis, emplee el método de 
Euler con tamaño de paso de 0.1. 

28.22 Las dinámicas del crecimiento de la población son importan- 
tes en varios estudios de planeación como el transporte y la ingenie- 
ría de los recursos hidráulicos. Uno de los modelos más simples de 
dicho crecimiento incorpora el supuesto de que la tasa de cambio 
de la población p es proporcional a la que existe en cualquier mo- 
mento £: 


fee Gp (P28.22.1) 


dt 


donde G = tasa de crecimiento (anual). Este modelo tiene sentido 
intuitivo porque entre mayor sea la población más grande será el 
número de padres potenciales. Al tiempo £ = 0, una isla tiene una 
población de 6 000 personas. Si G= 0.075 por año, emplee el méto- 
do de Heun (sin iteración) para predecir la población en £= 20 años, 
con el uso de un tamaño de paso de 0.5 años. Grafique p versus t, en 
forma estándar y en escala semilogarítmico. Determine la pendiente 
de la línea sobre la gráfica semilogarítmica. Analice sus resultados. 
28.23 Aunque el modelo del problema 28.22 funciona en forma 
adecuada cuando el crecimiento de la población es ilimitado, falla 
ante la existencia de factores como falta de comida, contaminación 
y falta de espacio, los cuales inhiben el crecimiento. En tales casos, 
la tasa de crecimiento se considera que es inversamente proporcional 
a la población. Un modelo de esta relación es 


G=G'(p..—p) (P28.23.1) 


máx 


donde G” = tasa de crecimiento dependiente de la población (por 
persona-año) y p,,, = población máxima sustentable. Así, cuando la 
población es pequeña (p < p,,..), la tasa de crecimiento será elevada 
y constante de G” p,. . En tales casos, el crecimiento es ilimitado y 
la ecuación (P28.23.1) en esencia es idéntica a la (P28.22.1). Sin 


embargo, conforme la población crece (es decir, conforme p se 
aproxima a p,,,.), G disminuye hasta cero, esto es cuando p = p,,.¿,. 
Así, el modelo predice que, cuando la población alcanza el nivel 
máximo sostenible, el crecimiento es inexistente, y el sistema se 
encontrará en estado estable. Al sustituir la ecuación (P28.23.1) en 
la (P28.22.1) se llega a 

4 _q 

a E Pmis =P) 
Para la misma isla que se estudió en el problema 28.22, emplee el 
método de Heun (sin iteración) para predecir la población en t= 20 
años, con el uso de un tamaño de paso de 0.5 años. Emplee valores de 
G = 107 por persona-año y p,,. = 20000 personas. Al tiempo f =0, 
la isla tiene una población de 6 000 personas. Grafique p versus t e 
interprete la forma de la curva. 
28.24 El Parque Nacional Isla Royal es un archipiélago de 210 millas 
cuadradas compuesto de una sola isla grande y muchas pequeñas, en 
el lago Superior. Alrededor de 1900 llegaron alces y hacia 1930, su 
población se acercaba a 3 000, por lo que devastaban la vegetación. 
En 1949, los lobos cruzaron un puente de hielo desde Ontario. Des- 
de finales de la década de 1950, se registran los números de alces y 
lobos, como se muestra a continuación. (Un guión indica que no hay 
datos.) 


Año 


Alces Lobos Año Alces Lobos 

960 700 22 1972 836 23 
961 — 22 1973 802 24 
962 —= 23 1974 815 30 
963 — 20 1975 778 41 
964 — 25 1976 641 43 
965 = 28 1977 507 33 
966 881 24 1978 543 40 
967 — 22 1979 675 42 
968 1000 22 1980 577 50 
969 1150 17 1981 570 30 
970 966 18 1982 590 13 

1983 811 23 


971 674 20 


a) Integre las ecuaciones de Lotka-Volterra de 1960 a 2020. De- 
termine los valores de los coeficientes que arrojan un ajuste 
óptimo. Compare su simulación con los datos que usan un 
enfoque de series de tiempo y comente los resultados. 

b)  Grafique la simulación de a), pero emplee un enfoque de espacio- 
fase. 

c) Después de 1993, suponga que los administradores de la vida 
silvestre atrapan un lobo por año y lo llevan fuera de la isla. 
Pronostique cómo evolucionaría tanto la población de lobos 
como de alces hacia el año 2020. Presente sus resultados tanto 
como una serie de tiempo como una gráfica de espacio-fase. 
Para este caso, así como para el inciso d), use los coeficientes 
que siguen: a=0.3, b=0.01111, c =0.2106, d = 0.0002632. 

d) Suponga que en 1993, algunos cazadores furtivos incursiona- 
ron en la isla y mataron al 50% de los alces. Pronostique cómo 
evolucionaría la población tanto de lobos como de alces hacia 
el año 2020. Presente sus resultados en gráficas tanto de series 
de tiempo como de espacio-fase. 

28.25 Un cable cuelga de dos apoyos en A y B (véase la figura 

P28.25). El cable sostiene una carga distribuida cuya magnitud varía 

con x según la ecuación 
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ha =50 ft 


w=w,[ 1 +sen (mx/21,) 


la L, =200 ft El 


Figura P28.25 


TX 
w=w,|1+sen| — 


donde w, = 1 000 lbs/ft. La pendiente del cable (dy/dx) = O en 
x= 0, que es el punto más bajo del cable. También es el punto donde 
la tensión del cable alcanza un mínimo de T,. La ecuación diferencial 
que gobierna el cable es 


Resuelva esta ecuación con el uso de un método numérico y grafique 
la forma del cable (y versus x). Para la solución numérica, se descono- 
ce el valor de 7, por lo que la solución debe utilizar una técnica itera- 
tiva, similar al método del disparo, para converger en un valor 
correcto de h, para distintos valores de 7. 

28.26 La ecuación diferencial básica de la curva elástica para una 
viga volada (véase la figura P28.26) está dada por 


2 


E AE 
dx 


2 
donde E = módulo de elasticidad e / = momento de inercia. Resuelva 
para la deflexión de la viga con el empleo de un método numérico. 
Se aplican los valores siguientes de parámetro: E = 30000 ksi, / = 


800 in*, P=1 kip, L= 10 ft. Compare sus resultados numéricos con 
la solución analítica, 


Px 
GEI 


_PLf 
2El 


y= 


=Y 


Figura P23.26 
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28.27 La ecuación diferencial básica de la curva elástica para una 
viga con carga uniforme (véase la figura P28.27) está dada por 


E dy _WwLx _wx? 


El=924= 
de 2 2 


donde E = módulo de elasticidad e /= momento de inercia. Resuelva 
para la deflexión de la viga usando a) la aproximación de diferencias 
finitas (Ax = 2 ft) y b) el método de disparo. Aplique los siguientes 
valores de parámetros: E = 30000 ksi, /= 800 in*, w = 1 kip/ft, L= 
10 ft. Compare sus resultados numéricos con la solución analítica, 


E wi ww wEx 
12E1 24EI 24EI 


y 


Figura P23.27 


28.28 Un estanque se drena a través de un tubo como se observa en 
la figura P28.28. Con suposiciones simplificadoras, la ecuación di- 
ferencial siguiente describe cómo cambia la profundidad con el 
tiempo: 


dh _ rd” PEMro 


de 4A(h) 


donde h/= profundidad (m), t = tiempo (Ss), d = diámetro del tubo (m), 
A(h) = área de la superficie del estanque como función de la profun- 
didad (m?), g = constante gravitacional (= 9.81 m/s?) y e = profundi- 
dad de la salida del tubo por debajo del fondo del estanque (m). Con 
base en la tabla siguiente de área-profundidad, resuelva esta ecuación 
diferencial para determinar cuánto tiempo tomaría que el estanque 
se vaciara dado que /(0) =6m,d=0.25m,e=1m. 


| 6 5 4 3 2 1 0 
0.97 0.67 0.45 0.32 0.18 0 


h,m 


A(h), 10* m? 


1.17 


A() 
Y eS (4) 


Figura P23.28 
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28.29 Los ingenieros y científicos utilizan modelos masa-resorte 
para entender la dinámica de las estructuras sujetas a la influencia de 
disturbios, como terremotos. En la figura P28.29 se ilustra una repre- 
sentación como ésas para un edificio de tres plantas. En este caso, 
el análisis se limita al movimiento horizontal de la estructura. Los 
balances de fuerza que se desarrollan para este sistema son los si- 
guientes 


k, +k, r k 
[4% E a E 
m m 
Ex q Ett ex E x,=0 
m, m, 2 


3 XL É 0 )x,-0 
Mm, m, 
Determine los valores y vectores propios y represente en forma grá- 
fica los modos de vibración de la estructura por medio de dibujar las 
amplitudes versus la altura para cada uno de los vectores propios. 
Normalice las amplitudes de modo que el desplazamiento del tercer 
piso sea igual a uno. 


mz=8 000 kg 


Sn 


m,= 10 000 kg 


Sn 


k; = 1 800 kN/m 


k, =2 400 kN/m 


m, = 12 000 kg 
ENT k, = 3 000 kN/m 
AAA 


Figura P28.29 


28.30 Con varias suposiciones de simplificación, la altura de estado 
estable del nivel hidrostático en un acuífero unidimensional no con- 
finado (figura P28.30) se puede modelar con la siguiente EDO de 
segundo orden: 


Superficie del suelo 


A 


VW | ] 


hu Nivel hidrostático 


Acuífero A 
Flujo de agua del suelo —— 


Lecho confinante 


Figura P283.30 
Un acuífero no confinado o “freático”. 


d? 

Kh—= q 
donde x = distancia (m), K = conductividad hidráulica [m/d], 
h = altura del nivel hidrostático [m], h = altura promedio del nivel 
hidrostático [m] y N = tasa de infiltración [m/d]. 

Despeje la altura del nivel hidrostático para x=0a 1000 m donde 
h(0) = 10 m y 1(1 000) = 5 m. Use los siguientes parámetros para el 
cálculo: K=1 m/d y N=0.0001 m/d. Ponga la altura promedio del 
nivel hidrostático como el promedio de las condiciones de frontera. 
Obtenga su solución con a) el método de disparo y b) el método de 
diferencias finitas (Ax = 100 m). 
28.31 En el problema 28.30 se usó un modelo linealizado de agua 
freática para simular la altura del nivel hidrostático para un acuífero 
no confinado. Se puede obtener un resultado más realista usando la 
siguiente EDO no lineal: 


a ge +N=0 
dx dx _ 


+N=0 


donde x = distancia [m], K = conductividad hidráulica [m/d], h = 
altura del nivel hidrostático [m] y N = tasa de infiltración [m/d]. 
Despeje la altura del nivel hidrostático para el mismo caso que en el 
problema 28.30. Es decir, despeje de x= 0 a 1000 m con (0) = 10 
m y h(1000)=5 m, K= 1 m/d y N=0.0001 m/d. Obtenga su solución 
con a) el método del disparo y b) el método de diferencias finitas 
(Ax = 100 m). 

28.32 Las ecuaciones de Lotka-Volterra que se describen en la sec- 
ción 28.2 se han refinado para incluir factores adicionales que im- 
pactan la dinámica depredador-presa. Por ejemplo, además de la 
depredación, la población de presas puede estar limitada por otros 
factores como el espacio. Las limitaciones de espacio se pueden in- 
corporar en el modelo como capacidad de acarreo (recuerde el mo- 
delo de logística descrito en el problema 28.16), como en 


dx x 
=a(1 )» bxy 
dt K 
dy 
A d 
En Cy + dxy 


donde K = capacidad de acarreo. Use los mismos valores de paráme- 

tros y condiciones iniciales que en la sección 28.2 para integrar estas 

ecuaciones de += 0 a 100, usando ode 45. 

a) Use un valor muy alto de K= 10% para validar que usted obtiene 
los mismos resultados que en la sección 28.2. 

b) Compare a) con una capacidad de acarreo más realista de 
K=200. Explique sus resultados. 

28.33 El crecimiento de algas unicelulares flotantes debajo de la 

descarga de una planta de tratamiento de aguas de drenaje se puede 

modelar con las siguientes EDO simultáneas: 


da 


e [k¿ (1, p) — ka — ks] a 
dn 

di = TncKhC A InaKkg(n, pja 
d 

_ => FpcKpC E FpaKkg(n, pja 
de 

di = TeaKga e KkpcC 


donde 1 = tiempo de viaje [d], a = concentración de clorofila en las 
algas [ugA/L], n = concentración de nitrógeno inorgánico [ugN/L], 
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p=concentración de fósforo inorgánico [ugP/L], c = concentración 
de detritus [ugC/L], k, = tasa de mortandad de las algas [/d], k = 
tasa de asentamiento de las algas [/d], k, = tasa de hidrólisis de 
detritus [/d], r,, = relación nitrógeno a Carbono [ugN/ugC], ss 
relación fósforo a carbono [ugP/ugCl, r,, = relación nitrógeno a 
clorofila [ugN/ugA], Pha = relación fósforo a clorofila [ugP/ugA] y 
K, (n, p) = tasa de crecimiento de las algas [/d], que se puede calcular 


con 


” Pp n 
ke(n, p) = k¿ mini ——, 
gl p) ES ber Em) 


donde k, = tasa de crecimiento de las algas con exceso de nivel de 
nutriente [/d], k,,= constante de media saturación de fósforo [1ugP/L] 
y k,, = constante de media saturación de nitrógeno [4gN/L]. Use las 
funciones ode45 y odel5s para resolver estas ecuaciones de £=0 
a 50 d, dadas las condiciones iniciales a = 1, n = 4000, p = 800 y 
c=0. Observe que los parámetros son k,=0.1, k =0.15, k, = 0.025, 
Pao = 0.18, r,,= 0.025, 1, 27.2, 1, = 1, F,, =40, k,=0.5, K, ,=2 y 
k,, =15. Desarrolle gráficas de ambas soluciones e interprete los re- 
sultados. 

28.34 Se han propuesto las siguientes EDO como modelo de una 
epidemia: 


dS 
— = -—asl 
dt 


donde S = los individuos susceptibles, 7 = los infectados, R = los 
recuperados, a = la tasa de infección y r = la tasa de recuperación. 
Una ciudad tiene 10000 habitantes, todos los cuales son susceptibles. 

a) Si un solo individuo infectado entra a la ciudad en £= 0, calcu- 
le la progresión de la epidemia hasta que el número de individuos 
infectados caiga por debajo de 10. Use los siguientes parámetros: 
a = 0.002/(persona - semana) y r = 0.15/d. Desarrolle gráficas 
de serie de tiempo de todas las variables de estado. También 
genere una gráfica de plano de fase S versus I versus R. 

b) Suponga que, después de la recuperación, hay una pérdida de 
inmunidad que causa que los individuos recuperados se vuelvan 
susceptibles. Este mecanismo de reinfección se puede calcular 
como pR, donde p = la tasa de reinfección. Modifique el mode- 
lo para que incluya este mecanismo y repita los cálculos de a) 
usando p = 0.015/d. 


Ingeniería eléctrica 

28.35 Realice el mismo cálculo que en la primera parte de la sección 
28.3, pero con R =0.025 (Q. 

28.36 Resuelva la EDO de la primera parte de la sección 8.3 de t£=0 
a 0.5, con técnicas numéricas, si q = 0.1 e ¿ =-3.281515 en 1=0. 
Utilice un valor de R= 50 y los mismos parámetros que en la sección 
8.3. 

28.37 Para un circuito sencillo RL, la ley de Kirchhoff del voltaje 
requiere que (si se cumple la ley de Ohm) 


Line 0 
dt 
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donde ¡ = corriente, L = inductancia y R = resistencia. Resuelva para 
i,siL=1,R=1.5 e 1(0) = 0.5. Resuelva este problema en forma 
analítica y con algún método numérico. Presente sus resultados en 
forma gráfica. 

28.38 En contraste con el problema 28.37, las resistencias reales no 
siempre siguen la ley de Ohm. Por ejemplo, la caída del voltaje qui- 
zá sea no lineal y la dinámica del circuito quede descrita por una 
relación como la siguiente 


donde todos los demás parámetros se definen como en el problema 
28.37 e les una corriente conocida de referencia e igual a 1. Resuel- 
va para ¡ como función del tiempo en las mismas condiciones que se 
especifican para el problema 28.37. 

28.39 Desarrolle un problema de valor propio para una red LC simi- 
lar a la de la figura 28.14, pero con sólo dos circuitos. Es decir, omita 
el circuito de ¿,. Dibuje la red e ilustre la forma en que las corrientes 
oscilan en sus modos primarios. 

28.40 Igual que se pueden usar la ley de Fourier y el balance térmi- 
co para caracterizar la distribución de temperaturas, hay disponibles 
relaciones análogas para modelar problemas de campo en otras áreas 
de la ingeniería. Por ejemplo, los ingenieros eléctricos usan un enfo- 
que similar cuando modelan campos electrostáticos. Bajo un núme- 
ro de supuestos simplificadores, se puede representar un análogo de 
la ley de Fourier en forma unidimensional como 


donde D se llama vector de densidad del flujo eléctrico, e = permiti- 
vidad del material y V = potencial electrostático. De manera similar, 
una ecuación de Poisson para campos electrostáticos se puede repre- 
sentar en una dimensión como 


Py Pu 
do € 


donde p,, = densidad de carga. Use la técnica de diferencia finita con 
Ax = 2 para determinar V para un alambre en el que V(0) = 1000, 
VQ0)=0,8=2,£=20 y p, = 30. 


Ingeniería mecánica/aeroespacial 

28.41 Lleve a cabo el mismo cálculo que en la sección 28.4 pero 
para un péndulo de 1 m de longitud. 

28.42 La tasa de enfriamiento de un cuerpo se expresa como 


dT 


7 KT —T,) 
donde T = temperatura del cuerpo (*C), T, = temperatura del medio 
circundante (*C) y k = constante de proporcionalidad (min”'). Así, 
esta ecuación especifica que la tasa de enfriamiento es proporcional 
a la diferencia de la temperatura del cuerpo y del ambiente circun- 
dante. Si una bola de metal se calienta a 90%C y se sumerge en agua 
que se mantiene a un valor constante de 7, = 20*C, utilice un método 
numérico para calcular el tiempo que toma que la bola se enfríe a 
40%C, si k=0.25 min”. 

28.43 La tasa de flujo calorífico (conducción) entre dos puntos de 
un cilindro calentado por un extremo está dada por 
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du de 


donde A = una constante, A = área de la sección transversal del ci- 
lindro, O = flujo calorífico, T = temperatura, f = tiempo y 
x = distancia a partir del extremo calentado. Debido a que la ecua- 
ción involucra dos derivadas, la ecuación se simplificará haciendo 
que 


dT _100(L—x)Q0—+1) 
dx 100 — xt 


donde L es la longitud de la barra. Combine las dos ecuaciones y 
calcule el flujo de calor de 1=0 a 25 s. La condición inicial es Q(0) 
= 0 y los parámetros son 4 = 0.5 cal - cm/s, A =12 cm?, L=20 cm y 
x=2.5 cm. Grafique sus resultados. 
28.44 Repita el problema del paracaidista (ejemplo 1.2), pero con la 
fuerza hacia arriba que se debe al arrastre igual a una tasa de segun- 
do orden: 

F, =-cv* 
donde c = 0.225 kg/m. Resuelva de £=0 a 30, grafique sus resultados 
y compárelos con los del ejemplo 1.2. 
28.45 Imagine que después de caer durante 13 s, el paracaidista de 
los ejemplos 1.1 y 1.2, tira de la cuerda de apertura. En este punto, 
suponga que el coeficiente de arrastre se incrementa en forma instan- 
tánea a un valor constante de 55 kg/s. Calcule la velocidad del para- 
caidista de + = 0 a 30 s con el método de Heun (sin iteración del 
corrector) con un tamaño de paso de 2 s. Grafique L versus t, de t=0 
a30s. 
28.46 La ecuación diferencial ordinaria siguiente describe el movi- 
miento de un sistema amortiguado resorte-masa (véase la figura 
P28.46): 


dt 


donde x = desplazamiento a partir de la posición de equilibrio, £ = 
tiempo, m= 1 kg masa y a = 5 N/(m/s)?. El término de amortigua- 
miento es no lineal y representa el amortiguamiento del aire. 

El resorte es un resorte cúbico y también es no lineal con 
b= 5 N/m*. Las condiciones iniciales son 


dx 
Velocidad inicial E =0.5 m/s 
Desplazamiento inicial x=1m 
PS x 


Resorte cúbico 


Amortiguamiento 


m el alre 
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Figura P28.46 


Resuelva esta ecuación con algún método numérico para el periodo 
de tiempo O < 1 < 8 s. Grafique el desplazamiento y la velocidad 
versus el tiempo, y grafique el retrato espacio-fase (velocidad versus 
desplazamiento) para todos los casos siguientes: 
a) Ecuación lineal similar 

dx dx 


m=>3+2—+5x=0 
dt dt 


b) La ecuación no lineal con sólo un término de resorte no lineal 


dx _dx 
+2 —+bx*=0 
di” dt 
c) La ecuación no lineal con sólo un término de amortiguamiento 
no lineal 
dx dx| dx 
m—=>3+4a|——+5x=0 
dt dt| dt 


d) La ecuación por completo no lineal en la que tanto el término 
de amortiguamiento como el de resorte son no lineales 


dx| dx 
t| dt 


+bx"=0 


28.47 Un sistema amortiguado y forzado resorte-masa (véase la fi- 
gura P28.47) tiene la ecuación diferencial ordinaria siguiente para su 
movimiento: 


dx 
m7 
dt 


dx 


a 
dt 


ae kx=F, sen(0wt) 
dt 


donde x = desplazamiento a partir de la posición de equilibrio, 
1 = tiempo, m= 2 kg masa, a = 5 N/(m/s) y k= 6 N/m. El término 
de amortiguamiento es no lineal y representa el amortiguamiento del 
aire. La función de fuerza F,sen(wt) tiene valores de F,=2.5 N y 
0 =0.5 rad/s. Las condiciones iniciales son 


Velocidad inicial 2 =0m/s 
dt 
Desplazamiento inicial x=1m 


Resuelva esta ecuación con el empleo de algún método numérico 
durante el periodo de tiempo O <1< 15 s. Grafique el desplazamien- 
to y la velocidad versus el tiempo, y grafique la función de fuerza 
sobre la misma curva. Asimismo, desarrolle una gráfica separada de 
la velocidad versus el desplazamiento. 


=> : 


Amortiguamiento por aire , 


F, sen(wt) 
| m 


/ 
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Figura P28.47 
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28.48 La distribución de temperatura en una aleta de enfriamiento 
cónica y ahusada (véase la figura P28.48) está descrita por la ecuación 
diferencial siguiente, que ha sido no dimensionada 


Pu (e ) 
3 += | —-pu|=0 
dx” xMdx 


donde u = temperatura (0 < u < 1), x = distancia axial (0 <x< 1), y 
p es un parámetro no dimensional que describe la transferencia de 
calor y la geometría 


= HE + 


ad k 2m? 


donde / = coeficiente de transferencia de calor, k = conductividad 
térmica, L = longitud o altura del cono, y m = pendiente de la pared 
del cono. La ecuación tiene las condiciones de frontera siguientes 


u(x=0)=0 ux=1)=1 


Resuelva esta ecuación para la distribución de temperatura con el 
empleo de métodos de diferencias finitas. Para las derivadas utilice 
diferencias finitas exactas de segundo orden análogas. Escriba un 
programa de computadora para obtener la solución y grafique la 
temperatura versus la distancia axial para distintos valores de p = 10, 
20, 50 y 100. 


u(x=0)=0 


7 u(x=1)=1 


Figura P23.48 


28.49 Las dinámicas de un sistema forzado resorte-masa- amorti- 
guador se representa con la EDO de segundo orden siguiente: 


dx 


m le] 
dt” 


dx 
+c—+kx>+ kx? =Pcos(ot) 
di ? 


donde m=1kg,c=0.4N - s/m, P=0.5 N y 0=0.5/s. Utilice un 
método numérico para resolver cuál es el desplazamiento (x) y la 
velocidad (L = dx/dt) como función del tiempo con condiciones ini- 
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ciales x =u = 0. Exprese sus resultados en forma gráfica como grá- 
ficas de series de tiempo (x y L versus t) y gráfica del espacio-fase 
(v versus x). Haga simulaciones para un resorte a) lineal (k, = 1; k, 
= 0) y b) no lineal (k, = 1; k, = 0.5). 

28.50 La ecuación diferencial para la velocidad de alguien que 
practica el salto del bungee es diferente según si el saltador ha caído 
una distancia en la que la cuerda está extendida por completo y co- 
mienza a encogerse. Así, si la distancia recorrida es menor que la 
longitud de la cuerda, el saltador sólo está sujeto a las fuerzas gravi- 
tacional y de arrastre. Una vez que la cuerda comienza a encogerse, 
también deben incluirse las fuerzas del resorte y del amortiguamien- 
to de la cuerda. Estas dos condiciones se expresan con las ecuaciones 
siguientes: 


“a? 


aa g—sign(v) 


v x<L 
dt m 
> eg-sign(v) Ca? 8 (x—L) E SE 
dt m m m 


donde v = velocidad (m/s), £= tiempo (s), g = constante gravitacional 
(= 9.81 m/s?), sign(x) = función que devuelve —1, O y 1, para x nega- 
tiva, cero y positiva, respectivamente, c, = coeficiente de arrastre de 
segundo orden (kg/m), m = masa (kg), k = constante de elasticidad 
de la cuerda (N/m), y = coeficiente de amortiguamiento de la cuerda 
(N - s/m) y £L = longitud de la cuerda (m). Determine la posición y 
velocidad del saltador dadas por los parámetros siguientes: L = 30 
m, m= 68.1 kg, c,= 0.25 kg/m, k =40 N/m y y = 8 kg/s. Haga el 
cálculo de £= 0 a 50 s y suponga que las condiciones iniciales son 
x(0) = v(0) =0. 
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28.51 Dos masas están fijadas a un muro mediante resortes lineales 
(figura P28.51). Los balances de fuerza basados en la segunda ley de 
Newton se pueden escribir como 


dx; ki ko 

ra (1 EN x1 — w1 — Lo) 
dx, ka 

7 a e x1 — w¡ — L)) 


donde k = constantes de elasticidad, m = masa, L = longitud del resor- 
te sin estirar y 0= anchura de la masa. Calcule las posiciones de las 
masas como función del tiempo usando los siguientes valores de 
parámetros: k, =k,=5,m,=m,=2,0,=0,=5 y L, =L,=2. Esta- 
blezca las condiciones iniciales como x, =£, y x,=L, + w, + £L, + 6. 
Realice la simulación de £ =0 a 20. Construya gráficas de series de 
tiempo de ambos desplazamientos y las velocidades. Además, pro- 
duzca una gráfica de plano de fase de x, vs. x,. 


L; w L, w> 
r yn Y yn - A Y y y 
Ki k, 
eta 20007 do 
o 0 060 ., 


0 Xx Xx, 


Figura P28.51 


EPÍLOGO: PARTE SIETE 


PT7.4 ALTERNATIVAS 


La tabla PT7.3 muestra las ventajas y las desventajas de los métodos numéricos para la solución de 
ecuaciones diferenciales ordinarias con valor inicial. Los factores considerados en esta tabla deben 
ser analizados por el ingeniero cuando seleccione un método para aplicarse en cada problema espe- 
cífico. 

Se pueden usar técnicas simples de autoinicio, como el método de Euler, si los requerimientos 
del problema presentan un intervalo corto de integración. En tal caso, es posible obtener una buena 
exactitud utilizando tamaños de paso pequeños para evitar grandes errores de truncamiento, y los 
errores de redondeo serán aceptables. El método de Euler también resulta apropiado en casos donde 
el modelo matemático tiene un alto nivel de incertidumbre, o tiene coeficientes o funciones de fuer- 
za con errores significativos, como los que llegan a surgir en un proceso de medición. En este caso, 
la exactitud del modelo mismo simplemente no justifica el trabajo de cálculo requerido al emplear 
un método numérico más complicado. Por último, en ocasiones, las técnicas más simples son las 
mejores cuando el problema o la simulación necesitan realizarse sólo unas cuantas veces. En dichos 
problemas, quizá sea mejor usar un método simple que sea fácil de programar y de entender, a pesar 
de que el método pueda ser ineficiente en términos computacionales y relativamente lento al correr- 
se en la computadora. 

Si el intervalo de integración del problema es lo suficientemente grande como para necesitar un 
gran número de pasos, entonces puede ser necesario y adecuado emplear una técnica más exacta que 
el método de Euler. El método RK de cuarto orden es popular y confiable para muchos problemas 
de ingeniería. En tales casos, también se aconseja estimar el error de truncamiento en cada paso 
como una guía para seleccionar el mejor tamaño de paso. Esto se lleva a cabo con los procedimien- 
tos RK adaptativos o con el método de Adams de cuarto orden. Si los errores de truncamiento son 
muy pequeños, podría ser acertado aumentar el tamaño de paso para ahorrar tiempo de computado- 
ra. Por otro lado, si el error de truncamiento es grande, se deberá disminuir el tamaño de paso para 


Tabla PT7.3 Comparación de las características de métodos alternativos para la solución numérica de EDO. 
Las comparaciones se basan en la experiencia general y no toman en cuenta el comportamiento 
de las funciones especiales. 


Valores Iteraciones Error Cambio de ta- Dificultad de 


Método iniciales requeridas global maño de paso programación Comentarios 
Un paso 
De Euler 1 No O(h) Fáci Escasa Bueno para estimaciones rápidas 
De Heun 1 Sí O(h? Fáci oderada = 
Punto medio 1 No O(h?) Fáci oderada = 
Ralston de segundo orden 1 o) O(h?) Fáci oderada El método RK de segundo orden 


que minimiza el error 
de truncamiento 


RK de cuarto orden 1 No O(h%) Fáci oderada Ampliamente usado 
Adaptativo de cuarto orden 
RK o RK-Fehlberg 1 No O(h*)* Fáci oderada La estimación del error permite 
a difícil ajuste del tamaño de paso 
De pasos múltiples 
Heun sin autoinicio 2 Sí O(h3)* Difícil oderada Método de pasos múltiples simple 
Heun a difícil 
De Milne 4 Sí O(h9)* Difícil oderada Algunas veces inestable 
a difícil 
Adams de cuarto orden 4 Sí O(h?)* Difícil oderada 
a difícil 


* Siempre que la estimación del error se utilice para modificar la solución. 
*Con tamaño de paso variable. 


654 


Epílogo: parte siete 


evitar la acumulación del error. Si se esperan problemas significativos de estabilidad, deberá evitar- 
se el método de Milne. El método de Runge-Kutta es simple de programar y fácil de usar; aunque 
llega a ser menos eficiente que los métodos de pasos múltiples. Sin embargo, el método de Runge- 
Kutta a menudo se utiliza en cualquier caso para obtener los valores iniciales requeridos en los 
métodos de pasos múltiples. 

Una gran cantidad de problemas de ingeniería pueden utilizar un intervalo intermedio de inte- 
gración y pocos requerimientos de exactitud. En tales casos, los métodos RK de segundo orden y de 
Heun sin autoinicio resultan fáciles de usar, y son relativamente eficientes y exactos. 

Los sistemas rígidos consideran ecuaciones con componentes que varían lenta y rápidamente. 
Por lo común, se requieren técnicas especiales para la solución adecuada de ecuaciones rígidas. Por 
ejemplo, se utilizan procedimientos implícitos. Usted puede consultar a Enright y cols. (1975), Gear 
(1971) y Shampine y Gear (1979) para obtener más información respecto a esas técnicas. 

Existen varias técnicas para resolver problemas de valores propios. Para sistemas pequeños o 
cuando sólo se requieren unos pocos de los valores propios menores o mayores, es posible usar 
procedimientos simples como el método de polinomios o el de potencias. Para sistemas simétricos, 
se emplean los métodos de Jacobi, de Given o de Householder. Por último, el método QR represen- 
ta un procedimiento general para encontrar todos los valores propios de matrices simétricas y no 
simétricas. 


PT7.5 RELACIONES Y FÓRMULAS IMPORTANTES 


La tabla PT7.4 resume la información importante que se presentó en la parte siete. Se recomienda 
consultar esta tabla para un rápido acceso a las relaciones y las fórmulas importantes. 


PT7.6 MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES 


Aunque hemos revisado varias técnicas para resolver ecuaciones diferenciales ordinarias, existe 
información adicional que es importante en la práctica de la ingeniería. El problema de la estabilidad 
se presentó en la sección 26.2.4. Este tema es de importancia relevante en todos los métodos para 
resolver EDO. Un análisis más amplio del tema se encuentra en Carnahan, Luther y Wilkes (1969), 
Gear (1971) y Hildebrand (1974). 

En el capítulo 27 presentamos los métodos para resolver problemas con valores en la frontera. 
Se sugiere consultar a Isaacson y Keller (1966), Keller (1968), Na (1979) y Scott y Watts (1976) para 
mayor información sobre problemas estándar con valores en la frontera. Material adicional acerca 
de los valores propios se encuentra en Ralston y Rabinowitz (1978), Wilkinson (1965), Fadeev y 
Fadeeva (1963), y Householder (1953, 1964). 

En resumen, lo anterior pretende ofrecerle caminos para una exploración más profunda sobre 
el tema. Además, todas las referencias anteriores proporcionan descripciones de las técnicas básicas 
que se estudiaron en la parte siete. Le recomendamos consultar estas fuentes alternativas para ampliar 
su comprensión de los métodos numéricos en la solución de ecuaciones diferenciales. 
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PT7.6 Métodos avanzados y referencias adicionales 
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PARTE OCHO 


ECUACIONES DIFERENCIALES 
PARCIALES 


PT8.1 MOTIVACIÓN 


Dada una función u que depende tanto de x como de y, la derivada parcial de u con respecto a x en 
un punto arbitrario (x, y) se define como 


0 u(x+Ax, y) —u(x, y) 


u - 
= lím 


(PT8.1) 
Ox  m>0 Ax 
De manera similar, la derivada parcial con respecto a y se define como 
94 _ pig Uy + Ay) =u(x, y) (PTS 2) 


dy Ay>0 Ay 


Una ecuación que tiene derivadas parciales de una función desconocida, de dos o más variables inde- 
pendientes, se denomina ecuación diferencial parcial, o EDP. Por ejemplo, 


y a? 


2 +2xy >+u=1 (PT8.3) 
Ox dy 
du du 
+ +8u=5 PT8.4 
dx*dy ió dy? ds ? 
Lu PP (PT8.5) 
dx? dxdy? 
y du 
o (PT8.6) 


El orden de una EDP es el de la derivada parcial de mayor orden que aparece en la ecuación. Por 
ejemplo, las ecuaciones (PT8.3) y (PT8.4) son de segundo y tercer orden, respectivamente. 

Se dice que una ecuación diferencial parcial es lineal, si es lineal en la función desconocida y 
en todas sus derivadas, con coeficientes que dependen sólo de las variables independientes. Por 
ejemplo, las ecuaciones (PT8.3) y (PT8.4) son lineales; mientras que las ecuaciones (PT8.5) y (PT8.6) 
no lo son. 

Debido a su amplia aplicación en ingeniería, nuestro estudio de las EDP se concentrará en las 
ecuaciones diferenciales lineales de segundo orden. Para dos variables independientes, tales ecua- 
ciones se pueden expresar de la forma general siguiente: 


+D=0 (PT8.7) 


donde A, B y C son funciones de x y y, y D es una función de x, y, u, du/dx y du/dy. Dependiendo de 
los valores de los coeficientes de los términos de la segunda derivada (A, B y C), la ecuación (PT8.7) 
se clasifica en una de tres categorías (tabla PT8.1). Esta clasificación, que se basa en el método de 
las características (por ejemplo, véase Vichnevetsky, 1981, o Lapidus y Pinder, 1981), es útil debido 
a que cada categoría se relaciona con problemas de ingeniería específicos y distintos, que demandan 
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Tabla PT8.1 Categorías en las que se clasifican las ecuaciones diferenciales parciales 
lineales de segundo orden con dos variables. 


B?-4AC Categoría Ejemplo 


<0 Elíptica Ecuación de Laplace (estado estacionario con dos dimensiones espaciales) 
2 2 
er + qn = 0 
ox” dy 
=0 Parabólica Ecuación de conducción del calor (variable de tiempo y una dimensión espacial) 
2 
Tp E 
ot 0X 
>0 Hiperbólica Ecuación de onda (variable de tiempo y una dimensión espacial) 
EY MP 
ox ct 


técnicas de solución especiales. Deberá observarse que en los casos donde A, B y C dependen de x 
y y, la ecuación puede encontrarse en una categoría diferente, dependiendo de la ubicación en el 
dominio donde la ecuación se satisface. Por sencillez, limitaremos el presente análisis a las EDP que 
pertenecen exclusivamente a una de las categorías. 


PT8.1.1 EDP y la práctica en ingeniería 


Cada una de las categorías de ecuaciones diferenciales parciales en la tabla PT8.1 corresponde a una 
clase específica de problemas en ingeniería. Las secciones iniciales de los siguientes capítulos se 
dedicarán a obtener cada tipo de ecuación para un problema de ingeniería en particular. En principio, 
analizaremos sus propiedades generales y sus aplicaciones, y mostraremos cómo se emplean en 
diferentes contextos físicos. 

Comúnmente, las ecuaciones elípticas se utilizan para caracterizar sistemas en estado estacio- 
nario. Como en la ecuación de Laplace de la tabla PT8.1, esto se indica por la ausencia de una de- 
rivada con respecto al tiempo. Así, estas ecuaciones se emplean para determinar la distribución en 
estado estacionario de una incógnita en dos dimensiones espaciales. 

Un ejemplo sencillo es la placa caliente de la figura PT8.1a. En tal caso, los bordes de la placa 
se mantienen a temperaturas diferentes. Como el calor fluye de las regiones de alta temperatura a 
las de baja temperatura, las condiciones de frontera establecen un potencial que lleva el flujo de 
calor de la frontera caliente a la fría. Si transcurre suficiente tiempo, este sistema alcanzará al final 
la distribución de temperatura estable o en estado estacionario representada en la figura PT8.1a. La 
ecuación de Laplace, junto con las condiciones de frontera adecuadas, ofrece un medio para deter- 
minar esta distribución. Por analogía, se puede utilizar el mismo procedimiento para abordar otros 
problemas que implican potenciales, como la filtración de agua bajo una presa (figura PT8.1b) o la 
distribución de un campo eléctrico (figura PT8.1c). 

A diferencia de la categoría elíptica, las ecuaciones parabólicas determinan cómo una incóg- 
nita varía tanto en el espacio como en el tiempo, lo cual se manifiesta por la presencia de las deri- 
vadas espacial y temporal, como la ecuación de conducción de calor considerada en la tabla PT8.1. 
Tales casos se conocen como problemas de propagación, puesto que la solución se “propaga”, o 
cambia, con el tiempo. 

Un ejemplo sencillo es el de una barra larga y delgada aislada, excepto en sus extremos (figura 
PT8.2a). El aislamiento se emplea para evitar complicaciones debido a la pérdida de calor a lo largo 
de la barra. Como en el caso de la placa caliente de la figura PT8.1a, los extremos de la barra se 
encuentran a una temperatura fija. Sin embargo, a diferencia de la figura PT8.1a, el espesor de la 
barra nos permite suponer que el calor se distribuye de manera uniforme sobre su sección transver- 
sal (es decir, lateralmente). En consecuencia, el flujo de calor lateral no es un problema, y el proble- 
ma se reduce a estudiar la conducción del calor a lo largo del eje longitudinal de la barra. En lugar 
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Figura PT8.1 


Tres problemas de distribución en estado estacionario que pueden caracterizarse por EDP elípticas. a) Distribución de temperatura sobre 
una placa caliente; b) filtración de agua bajo una presa, y c) el campo eléctrico cerca del punto de un conductor. 


de concentrarse en la distribución en estado estacionario en dos dimensiones espaciales, el problema 
consiste en determinar cómo la distribución espacial en una dimensión cambia en función del tiem- 
po (figura PT8.2b). Así, la solución consiste de una serie de distribuciones espaciales que corres- 
ponden al estado de la barra en diferentes momentos. Usando una analogía con la fotografía, la 
categoría elíptica da una imagen del sistema en estado estacionario; mientras que la categoría para- 
bólica ofrece una película de cómo cambia de un estado a otro. Como con los demás tipos de EDP 
descritos aquí, las ecuaciones parabólicas son útiles para caracterizar, por analogía, una amplia 


variedad de otros problemas de ingeniería. 


La clase final de EDP, la categoría hiperbólica, también tiene que ver con problemas de propa- 
gación. Sin embargo, una importante diferencia manifestada por la ecuación de onda, en la tabla PT8.1, 


es que la incógnita se caracteriza por una segunda derivada con 
respecto al tiempo. En consecuencia, la solución oscila. 

La cuerda vibrante de la figura PT8.3 es un modelo físico 
sencillo que puede describirse por la ecuación de onda. La solución 
consiste de varios estados característicos en que la cuerda oscila. 
Varios sistemas de ingeniería (como las vibraciones de barras y 
vigas, los movimientos de ondas de fluido y la transmisión de 
señales acústicas y eléctricas) pueden caracterizarse con este 
modelo. 


PT8.1.2 Métodos anteriores a la computadora 
para resolver EDP 


Antes de la era de las computadoras digitales, los ingenieros 
dependían de las soluciones analíticas o exactas para las ecua- 
ciones diferenciales parciales. Aparte de los casos más simples, 
dichas soluciones requerían de un gran esfuerzo y complejidad 
matemática. Además, muchos sistemas físicos no podían resol- 
verse directamente; tenían que simplificarse utilizando lineali- 
zaciones, representaciones geométricas sencillas y otras 
idealizaciones. Aunque esas soluciones son elegantes y profundas, 
están limitadas con respecto a la fidelidad para representar sis- 
temas reales (en especial, aquellos que son altamente no lineales 
y de forma irregular). 


Caliente Frío 


a) 


xY 


b) 


Figura PT8.2 

a) Barra larga y delgada que está aislada, excepto en sus 
extremos. La dinámica de la distribución unidimensional 
de temperatura a lo largo de la barra puede describirse 
mediante una EDP parabólica. b) La solución, que consiste 
en distribuciones correspondientes al estado de la barra en 
diferentes momentos. 
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Figura PT8.3 


Una cuerda tensa que vibra a baja amplitud es un 
sistema físico simple que puede caracterizarse por una 


EDP hiperbólica. 


Parte 8 Ecuaciones diferenciales parciales 


PT8.2 ORIENTACIÓN 


Antes de proceder con los métodos numéricos para resolver ecuaciones diferenciales parciales, al- 
guna orientación resultará de utilidad. La siguiente información tiene el propósito de presentarle un 
panorama general del material analizado en la parte ocho. Además, hemos formulado objetivos para 
concentrar sus estudios en el tema. 


PT8.2.1 Alcance y presentación preliminar 


La figura PT8.4 muestra un panorama general de la parte ocho. En esta parte del libro se analizarán 
dos amplias categorías de métodos numéricos. Los procedimientos por diferencias finitas, que se 
cubrirán en los capítulos 29 y 30, se basan en la aproximación de la solución en un número finito de 
puntos. En cambio, los métodos por elementos finitos, que se estudiarán en el capítulo 31, aproximan 
la solución por partes o “elementos”. Varios parámetros se ajustan hasta que las aproximaciones 
conformen la ecuación diferencial correspondiente en un sentido óptimo. 

El capítulo 29 se dedica a soluciones por diferencias finitas de ecuaciones elípticas. Antes de 
poner en práctica los métodos, deducimos la ecuación de Laplace para el problema físico de la dis- 
tribución de temperatura en una placa caliente. Después, se describe un procedimiento estándar de 
solución: el método de Liebmann. Ilustraremos cómo se utiliza dicho procedimiento para calcular 
la distribución de la variable escalar principal, la temperatura, así como la de una variable vectorial 
secundaria: el flujo de calor. La última sección del capítulo se ocupa de las condiciones de frontera. 
Este material comprende procedimientos para diferentes tipos de condiciones, así como para fron- 
teras irregulares. 

En el capítulo 30 se estudian las soluciones por diferencias finitas de ecuaciones parabólicas. 
Como en el análisis de ecuaciones elípticas, primero ofreceremos una introducción a un problema 
físico, la ecuación de conducción del calor en una barra unidimensional. Después presentamos al- 
goritmos implícitos y explícitos para resolver esta ecuación. Luego se analiza un método implícito 
eficiente y confiable: la técnica de Crank-Nicolson. Por último, describimos un procedimiento par- 
ticularmente efectivo para resolver ecuaciones parabólicas bidimensionales, el método implícito de 
dirección alternante, o método IDA. 

Observe que hemos omitido las ecuaciones hiperbólicas por estar más allá del alcance de este 
libro. El epílogo de esta parte del libro contiene referencias relacionadas con este tipo de EDP. 

En el capítulo 31 veremos otro procedimiento fundamental para resolver EDP: el método del 
elemento finito. Como es esencialmente diferente del procedimiento por diferencias finitas, hemos 
dedicado la sección inicial del capítulo a una visión general. Después mostramos cómo se utiliza el 
método del elemento finito para calcular la distribución de temperatura en estado estacionario de 
una barra caliente. Por último, ofrecemos una introducción a algunos de los problemas al extender 
este análisis a problemas bidimensionales. 

El capítulo 32 se dedica a problemas en todos los campos de la ingeniería. Por último, se pre- 
senta una breve sección de repaso al final de la parte ocho. Este epílogo resume información impor- 
tante relacionada con las EDP. Este material comprende un análisis de las ventajas y las desventajas 
esenciales para su implementación en la ingeniería. El epílogo también incluye referencias para temas 
avanzados. 


PT8.2.2 Metas y objetivos 


Objetivos de estudio Al terminar la parte ocho, deberá haber incrementado su capacidad para 
enfrentar y resolver ecuaciones diferenciales parciales. Las metas de estudio generales deberán com- 
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prender el dominio de las técnicas, teniendo la capacidad de evaluar la confiabilidad de las respues- 
tas, y de elegir el “mejor” método (o métodos) para cualquier problema particular. Además de estos 
objetivos generales, deberán dominarse los objetivos de estudio específicos de la tabla PT8.2. 


Objetivos de cómputo Se pueden desarrollar algoritmos computacionales para muchos de los 
métodos de la parte ocho. Por ejemplo, usted puede encontrar ilustrativo el desarrollo de un progra- 
ma general, para simular la distribución de la temperatura en estado estacionario sobre una placa 
caliente. Además, tal vez usted quiera desarrollar programas para implementar el sencillo método 
explícito y el de Crank-Nicolson, para resolver EDP parabólicas en una dimensión espacial. 

Por último, una de sus metas más importantes deberá ser dominar varios de los paquetes de 
software de uso general ampliamente difundidos. En particular, usted deberá volverse un adepto al 
uso de esas herramientas para implementar métodos numéricos que resuelvan problemas de inge- 
niería. 
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Figura PT8.4 
Representación esquemática de la organización del material de la parte ocho: Ecuaciones diferenciales parciales. 
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Tabla PT8.2 Objetivos específicos de estudio de la parte ocho. 


Reconocer la diferencia entre las EDP elípticas, parabólicas e hiperbólicas. 

Comprender la diferencia fundamental entre los procedimientos de diferencias finitas y de elementos finitos. 
Entender que el método de Liebmann es equivalente al método de Gauss-Seidel para resolver ecuaciones 
algebraicas lineales simultáneas. 

Saber cómo determinar variables secundarias para problemas de campos bidimensionales. 

Distinguir la diferencia entre las condiciones Dirichlet y las condiciones de la derivada en la frontera. 

Saber cómo usar factores ponderados para incorporar fronteras irregulares en un esquema por diferencias 
finitas para las EDP. 

Implementar la aproximación del volumen de control para las soluciones numéricas de las EDP. 

Conocer la diferencia entre convergencia y estabilidad de EDP parabólicas. 

Distinguir la diferencia entre esquemas explícitos y esquemas implícitos para resolver EDP parabólicas. 
Reconocer cómo los criterios de estabilidad para métodos explícitos disminuyen en su utilidad para resolver 
EDP parabólicas. 

Saber cómo interpretar moléculas computacionales. 

Comprender cómo el procedimiento IDA tiene alta eficiencia en la solución de ecuaciones parabólicas en dos 
dimensiones espaciales. 

Comprender la diferencia entre el método directo y el método de residuos ponderados para deducir elemen- 
tos de ecuaciones. 

Saber cómo implementar el método de Galerkin. 

Entender los beneficios de la integración por partes durante la deducción de elementos de ecuaciones; en 
particular, reconocer las implicaciones que se tienen al disminuir la segunda derivada a una primera derivada. 


Diferencias finitas: ecuaciones 
elípticas 


En ingeniería, las ecuaciones elípticas se usan comúnmente para caracterizar problemas en estado 
estacionario con valores en la frontera. Antes de mostrar la manera en que se resuelven, ilustraremos 
cómo se deduce en un caso simple (la ecuación de Laplace), a partir de un problema físico. 


29.1 LA ECUACIÓN DE LAPLACE 


Como se mencionó en la introducción de esta parte del libro, la ecuación de Laplace se utiliza para 
modelar diversos problemas que tienen que ver con el potencial de una variable desconocida. De- 
bido a su simplicidad y a su relevancia en la mayoría de las áreas de la ingeniería, usaremos una 
placa caliente para deducir y resolver esta EDP elíptica. Se emplearán problemas académicos y 
problemas de la ingeniería (capítulo 32) para ilustrar la aplicabilidad del modelo a otros problemas 
de ingeniería. 

En la figura 29.1 se muestra un elemento sobre la cara de una placa rectangular delgada de es- 
pesor Az. La placa está totalmente aislada excepto en sus extremos, donde la temperatura puede 
ajustarse a un nivel preestablecido. El aislamiento y el espesor de la placa permiten que la transfe- 
rencia de calor esté limitada solamente a las dimensiones x y y. En estado estacionario, el flujo de 
calor hacia el elemento en una unidad de tiempo Af debe ser igual al flujo de salida, es decir, 


q(x) Ay Az At+ q(y) Ax Az At= q(x + Ax) Ay Az At + q(y + Ay)Ax Az At (29.1) 


donde qg(x) y q(y) = los flujos de calor en x y y, respectivamente [cal/(cm? - s)]. Dividiendo entre Az 
y At, y reagrupando términos, se obtiene 


[q(x) — q(x + Ax)] Ay + [90 — q(y + Ay)]Ax = 0 


Multiplicando el primer término por Ax/Ax, y el segundo por Ay/Ay 
se obtiene 


q(x)-q(x+Ax) 


Ar Ay+ a)-ay+Ay) Ay Ar=0 (29.2) 
Ay aly + Ay) 


Dividiendo entre Ax Ay, y tomando el límite, se llega a 


qlx) 


qlx+ Ax) 


Ay 


¿0 a 


29.3 AS 
dx  0y si 


donde las derivadas parciales resultan de las definiciones en las a 


ecuaciones (PT8.1) y (PT8.2). 


t 


La ecuación (29.3) es una ecuación diferencial parcial, que NS ! - 
es una expresión de la conservación de la energía en la placa. Sin 
embargo, la ecuación no puede resolverse, a menos que se espe- A Ax 
cifiquen los flujos de calor en los extremos de la placa. Debido a 
que se dan condiciones de frontera para la temperatura, la ecuación Figura 29.1 


(29.3) debe reformularse en términos de la temperatura. La relación — Placa delgada de espesor Az. Se muestra un elemento, con 


entre flujo y temperatura está dada por la ley de Fourier de con- el cual se hace el balance de calor. 
ducción del calor, la cual se representa como 


=Y 
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Figura 29.2 


Representación gráfica de un gradiente de tem- 
peratura. Debido a que el calor se transfiere hacia 
abajo desde una temperatura alta a una baja, el 


flujo 


en a) va de izquierda a derecha en la dirección 


¡ positiva. Sin embargo, debido a la orientación de 
las coordenadas cartesianas, la pendiente es nega- 
tiva en este caso. Es decir, un gradiente negativo 

se relaciona con un flujo positivo. Éste es el origen 
del signo menos en la ley de Fourier de conducción 
de calor. El caso inverso se ilustra en b), donde el 
gradiente positivo se relaciona con un flujo de calor 
negativo de derecha a izquierda. 


q¡> ae 


29.4 
di ide 


donde q,= flujo de calor en la dirección de la dimensión ¡ [cal/(cm? - s)], 
k= coeficiente de difusividad térmica (cm?/s), p = densidad del material 
(g/cm?), C = capacidad calorífica del material [cal/(g - *C)] y T= tempe- 
ratura (*C), que se define como 


HB 
pCcv 


donde H = calor (cal) y V = volumen (cm). Algunas veces, el término 
que está multiplicando a la derivada parcial en la ecuación (29.4) se trata 
como un solo término, 


k =kpC (29.5) 


donde k* se conoce como el coeficiente de conductividad térmica [cal/ 
(s - cm - 9C)]. En ambos casos, k y k” son parámetros que determinan qué 
tan bien conduce calor el material. 

A la ley de Fourier algunas veces se le llama ecuación constitutiva. 
Esta connotación se le da porque proporciona un mecanismo que define 
las interacciones internas del sistema. Una inspección de la ecuación (29.4) 
indica que la ley de Fourier especifica que el flujo de calor perpendicular 
al eje ¡ es proporcional al gradiente o pendiente de la temperatura en la 
dirección ¡. El signo negativo asegura que un flujo positivo en la dirección 
i resulta de una pendiente negativa de alta a baja temperatura (figura 29.2). 
Sustituyendo la ecuación (29.4) en la ecuación (29.3), se obtiene 


Pr ar 
dx? dy 


0 (29.6) 


que es la ecuación de Laplace. Observe que en el caso donde hay fuentes 
O pérdidas de calor dentro del dominio bidimensional, la ecuación se 
puede representar como 


(29.7) 


donde f(x, y) es una función que describe las fuentes o pérdidas de calor. 
La ecuación (29.7) se conoce como ecuación de Poisson. 


29.2 TÉCNICA DE SOLUCIÓN 


Para la solución numérica de las EDP elípticas, como la ecuación de Laplace, se procede en dirección 
contraria a como se dedujo la ecuación (29.6) en la sección anterior. Recuerde que la deducción de 
la ecuación (29.6) emplea un balance alrededor de un elemento discreto para obtener una ecuación 
algebraica en diferencias, que caracteriza el flujo de calor para una placa. Tomando el límite, esta 
ecuación en diferencias se convirtió en una ecuación diferencial [ecuación (29.3)]. 

En la solución numérica, las representaciones por diferencias finitas basadas en tratar la placa 
como una malla de puntos discretos (figura 29.3) se sustituyen por las derivadas parciales en la 
ecuación (29.6). Como se describe a continuación, la EDP se transforma en una ecuación algebraica 


en diferencias. 


29.2.1 La ecuación laplaciana en diferencias 


Las diferencias centrales basadas en el esquema de malla de la figura 29.3 son (véase figura 23.3) 
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Figura 29.3 ; 
Malla usada para la solución por diferencias finitas de las 
EDP elípticas en dos variables independientes, como la ecua- code lo 
ción de Laplace. 0, n + 1 ——+———————————— 4 
0 + $ $ $ + $ + $ 
2 
T IS PE e + + + + + + + + 
TE 2 


27 2 -—e e A O ES 


las cuales tienen errores de O[A(x)?] y O[A(y?], respecti- 
vamente. Sustituyendo estas expresiones en la ecuación A A A A A A 
(29.6) se obtiene 


Taj -21,, UY de Die -2T,, +1, 


jodo 


2 2 
X y 
En la malla cuadrada de la figura 29.3, Ax = Ay, y reagrupando términos, la ecuación se convierte 
en 
T +47 ,+T, +T, -4T =0 (29.8) 
i+1j i-1)j ij+l ij—1 bj 
Esta relación, que se satisface por todos los puntos interiores de la placa, se conoce como ecuación 
laplaciana en diferencias. 

Además, se deben especificar las condiciones de frontera en los extremos de la placa para obte- 
ner una solución única. El caso más simple es aquel donde la temperatura en la frontera es un valor 
fijo. Esta se conoce como condición de frontera de Dirichlet. Tal es el caso de la figura 29.4, donde 
los extremos se mantienen a temperaturas constantes. En el caso ilustrado en la figura 29.4, un ba- 
lance en el nodo (1, 1) es, de acuerdo con la ecuación (29.8), 

TL, HT +T +7, -4T,,=0 (29.9) 


1 
Sin embargo, 7, =75 y T,,=0, y, por lo tanto, la ecuación (29.9) se expresa como 
AT, +T,,+T,, =-75 


Ecuaciones similares se pueden desarrollar para los otros puntos interiores. El resultado es el 
siguiente conjunto de nueve ecuaciones simultáneas con nueve incógnitas: 


4T, —,, —T.,, = 75 
1 +47, PT, —D, = 0 
—,, HT, —.,, = 50 

LT, +HT, Ls LT, = 75 
—, TT, +4T,, —T.,, —,, = 0 

—T,, —, +47, Ta = 50 

—T., HT, —D = 175 

—, LT, +4T,, Ta = 100 

—T.,, —,, HT, = 150 


(29.10) 


666 


75*C 


Capítulo 29 Diferencias finitas: ecuaciones elípticas 


100*C Figura 29.4 
Una placa caliente donde las temperaturas en la frontera se mantienen a niveles 

(1, 3) (2, 3) (3, 3) constantes. Este caso se denomina condición de frontera de Dirichlet. 

o o o 
(1, 2) (2, 2) (3, 2) 

o e e 50C 
(1,1) (2,1) (3, 1) 29.2.2 El método de Liebkhmann 

o o 0 

a En la mayoría de las soluciones numéricas de la ecuación de Laplace se tienen 
os 


sistemas que son mucho más grandes que la ecuación (29.10). Por ejemplo, para 
una malla de 10 por 10 se tienen 100 ecuaciones algebraicas lineales. En la parte 
tres se analizaron técnicas de solución para estos tipos de ecuaciones. 

Observe que hay un máximo de cinco incógnitas por línea en la ecuación (29.10). Para mallas 
grandes se encuentra que un número significativo de los términos será igual a cero. Cuando se apli- 
can los métodos de eliminación con toda la matriz a estos sistemas dispersos, se ocupa una gran 
cantidad de memoria de la computadora, almacenando ceros. Por esta razón, los métodos aproxima- 
dos representan un mejor procedimiento para obtener soluciones de EDP elípticas. El método co- 
múnmente empleado es el de Gauss-Seidel, el cual, cuando se aplica a las EDP, también se conoce 
como el método de Liebmann. Con esta técnica, la ecuación (29.8) se expresa como 


y, a (29.11) 


y se resuelve de manera iterativa para ¡= 1 hasta ne ¡= 1 hasta m. Como la ecuación (29.8) es dia- 
gonalmente dominante, este procedimiento al final convergerá a una solución estable (recuerde la 
sección 11.2.1). Algunas veces se utiliza la sobrerrelajación para acelerar la velocidad de la conver- 
gencia, aplicando la siguiente fórmula después de cada iteración: 


pil = y bid + a _ O e (29.12) 


donde LY ai son los valores de Tu de la actual iteración y de la previa, respectivamente; 4 
es un factor de ponderación que está entre 1 y 2. 

Como en el método convencional de Gauss-Seidel, las iteraciones se repiten hasta que los valo- 
res absolutos de todos los errores relativos porcentuales (E), están por debajo de un criterio prees- 
pecificado de terminación e . Dichos errores relativos porcentuales se estiman mediante 


nuevo anterior 


=P 100% (29.13) 


nuevo 
z; 


kE): 


EJEMPLO 29.1 Temperatura de una placa caliente con condiciones de frontera fijas 


Planteamiento del problema Con el método de Liebmann (Gauss-Seidel) calcule la tempera- 
tura de la placa caliente de la figura 29.4. Emplee la sobrerrelajación con un valor de 1.5 para el 
factor de ponderación, e ¡tere hasta e = 1%. 


Solución La ecuación (29.11) eni=1,j=1es 


TA id 
4 


y aplicando sobrerrelajación se obtiene 


T,, =1.508.75) + (1 - 1.5)0 = 28.125 


29.2 Técnica de solución 


Parai=2,j=1, 100"C 
T, = 0+28.125+0+0 =7.03105 78.59 76.06 69.71 
: 4 
T,, = 1.50/.03125) + (1 — 1.5)0 = 10.54688 75% | 63.21 56.11 52.34 | 50C 
Parai=3,j=1, 
43.00 33.30 33.89 
pa 50+10.54688+0+0 _ 1513672 
ñ 0*C 


T,, = 1.5(15.13672) + (1 — 1.5)0 = 22.70508 


El cálculo se repite con los otros renglones: 
T,, = 38.67188 T,, = 18.45703 T,, = 34.18579 
T,,= 80.12696 T,, = 74.46900 T,, = 96.99554 


Como todos los 7, ,son inicialmente cero, entonces todos los e, para la primera iteración serán 100%. 
En la segunda iteración, los resultados son: 


T, =32.519533  T,=22.35718  T,=28.60108 
T,,=57.95288  T,=61.63333  T,,=71.86833 
T,,=75.21973  T,=8795872  T,,=67.68736 


El error para Ey se estima como sigue [ecuación (29.13)] 


fe, ] PR 100% =13.5% 
32.51953 


Debido a que este valor está por arriba del criterio de terminación de 1%, se continúa el cálculo. La 
novena iteración da como resultado 


T,, =43.00061  T,=33.29755  T,=33.88506 
T,,=63.21152  T,=56.11238  T,=52.33999 
T,,=78.58718  T,=76.06402  T,=69.71050 


donde el error máximo es 0.71%. 
En la figura 29.5 se muestran los resultados. Como se esperaba, se ha establecido un gradiente 
al fluir el calor de altas a bajas temperaturas. 
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Figura 29.5 
Distribución de tem- 
peratura en una placa 
Caliente, sujeta a con- 
diciones de frontera 
fijas. 


29.2.3 Variables secundarias 


Como la distribución de temperatura está descrita por la ecuación de Laplace, ésta se considera la 
variable principal en el problema de la placa caliente. En este caso, así como en otros problemas 
donde se tengan EDP, las variables secundarias también pueden ser importantes. De hecho, en cier- 
tos contextos de ingeniería, la variable secundaria puede realmente ser más importante. 

En la placa caliente, una variable secundaria es el flujo de calor a través de la superficie de la 
placa. Esta cantidad se calcula a partir de la ley de Fourier. Las aproximaciones por diferencias fi- 
nitas centradas para las primeras derivadas (recuerde la figura 23.3) se sustituyen en la ecuación 
(29.4) para obtener los siguientes valores del flujo de calor en las dimensiones x y y: 

T, 


a. + 
4, 2 y 


Dj 
(29.14) 
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a (29.15) 


El flujo de calor resultante se calcula a partir de estas dos cantidades mediante 


A= +A (29.16) 


donde la dirección de q, está dada por 


8= un 2) (29.17) 
UB 
para q,>0 y 
B= an 2 je T (29.18) 
UB 


para q, < 0. Recuerde que el ángulo puede expresarse en grados multiplicándolo por 180%77. Si q,=0, 
0 es 1/2 (909) o 375/2 (2707), según q, sea positivo o negativo, respectivamente. 


EJEMPLO 29.2 Distribución de flujo en una placa caliente 


Planteamiento del problema Empleando los resultados del ejemplo 29.1 determine la distri- 
bución del flujo de calor en la placa caliente de la figura 29.4. Suponga que la placa es de 40 x 40 
cm y que está hecha de aluminio [X” = 0.49 cal/(s - cm - *C)]. 
Solución Para i¡=¿= 1, la ecuación (29.14) se utiliza para calcular 

cal  (33.29755-T75)C 
s-cm-*C 2(10 cm) 
y [de la ecuación (29.15)] 


q, =-0.49 =1.022 cal/(cm? -s) 


cal (63.21152-0)C _ 


q, = 0.49 
s-cm-«"C 2(10 cm) 


1.549 cal/(cm? -s) 


El flujo resultante se calcula con la ecuación (29.16): 


a, =>/(1.022) + (21.549)? =1.856 cal/(cm? -s) 


y el ángulo de su trayectoria mediante la ecuación (29.17) 


100*C 


8= ar ) = -0.98758x 0 56.584 
1.022 T 


AN Así, en este punto, el flujo de calor está dirigido hacia 
abajo y a la derecha. Pueden calcularse los valores en otros 


puntos de la malla; los resultados se muestran en la figu- 


k k soc a 29.6. 


Figura 29.6 

Flujo de calor en una placa sujeta a temperaturas fijas en 

las fronteras. Observe que la longitud de las flechas es 
0*C 


75C 


proporcional a la magnitud del flujo. 


29.3 Condiciones en la frontera 


29.3 CONDICIONES EN LA FRONTERA 


Debido a que está libre de complicaciones, la placa rectangular con condiciones de frontera 
fijas representa un ideal para mostrar cómo se resuelven numéricamente las EDP elípticas. 
Ahora veremos otro problema que ampliará nuestras habilidades para abordar problemas más 
realistas. Éste considera fronteras en donde se especifica la derivada, y fronteras que tienen 
forma irregular. 


29.3.1 Condiciones con derivada en la frontera 


La condición de frontera fija o de Dirichlet analizada hasta ahora es uno de los diferentes tipos 
usados en las ecuaciones diferenciales parciales. Una alternativa común es el caso donde se da 
la derivada, que se conoce comúnmente como una condición de frontera de Neumann. En el 
problema de la placa caliente, esto corresponde a especificar el flujo de calor, más que la tem- 
peratura en la frontera. Un ejemplo es la situación donde el extremo está aislado. En tal caso, la 


To, j+1 


Figura 29.7 

Un nodo frontera (0, /) en 
el extremo izquierdo de 
una placa caliente. Para 
aproximar la derivada nor- 
mal al extremo (es decir, la 
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derivada x), se localiza un 
punto imaginario (-1, j) a 
una distancia Ax más allá 


derivada es cero. Esta conclusión se obtiene directamente de la ecuación (29.4), ya que aislar 
una frontera significa que el flujo de calor (y, en consecuencia, el gradiente) debe ser cero. Otro 
ejemplo sería el caso donde se pierde calor a través del extremo por mecanismos predecibles, 


eS Eo del extremo. 
como radiación y convección. 
En la figura 29.7 se muestra un nodo (0, j) en el extremo izquierdo de una placa caliente. 
Aplicando la ecuación (29.8) en este punto, se obtiene 
E Sie =0 (29.19) 


Observe que para esta ecuación se necesita un punto imaginario (-1, j) que esté fuera de la placa. 
Aunque este punto exterior ficticio podría parecer que representa un problema, realmente sirve para 
incorporar la derivada de la condición de frontera en el problema, lo cual se logra representando la 
primera derivada en la dimensión x en (0, 7) por la diferencia dividida finita 


or _T,-T 


oT Ey 
Ox 


2 Ax 
donde se puede despejar 


OT 
TP, = E 


Ahora se tiene una relación para T,,que incluye la derivada. Esta relación se sustituye en la ecuación 
(29.19) para obtener 
2T,,-2 x 


+To ¡1 4Tp,=0 (29.20) 


UN 0.j+1 a 


T 
—+T, 
x 
Así, hemos incorporado la derivada en la ecuación. 
Es posible desarrollar relaciones similares para las condiciones de frontera con derivadas en los 
otros extremos. El siguiente ejemplo muestra cómo llevarlo a cabo en la placa caliente. 


EJEMPLO 29.3 Placa caliente con un extremo aislado 


Planteamiento del problema Repita el mismo problema del ejemplo 29.1, pero con el extremo 
inferior aislado. 


Solución La ecuación general que caracteriza una derivada en el extremo inferior (es decir, en 
j =0) en una placa caliente es 


Do =0 


¿0 


T 
+T,_¡p+21,,-2 y 4T, 
y 
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100 100 100 Figura 29.8 
e . . . 9? Temperatura y distribución de flujo en una placa 
Caliente sujeta a condiciones de frontera fijas, ex- 
cepto en un extremo inferior aislado. 
75 $ 834g 82.6% 1 e 50 
75 $ 760% 728% 644 + 50 Enel extremo aislado, la derivada es cero y la 
ecuación se convierte en 
75 4 728% 6830 60.68. + 50 haga LEO 
Las ecuaciones simultáneas para la distribución de 
71.9 67.0 59.5 temperatura en la placa de la figura 29.4 con un 
15 y TH TIA TA 77A 50 extremo inferior aislado se escribe en forma ma- 
Aislado tricial como 
[4 -1 —2 Vo 75 
1. 4 -1 —2 Do 0 
1 4 -2 Do 50 
-1 4 -1 -1 BL 75 
1 1 4 1 1 BD; 0 
-1 1 4 -1 L, 50 
1 de al =] 0 + 
-1 1.4 1 1 D, 0 
-1 -1 4 A 1, 50 
—1 4 -1 Ta 175 
1 1.4 11D, 100 
| al 1 4|7,) (150 


Observe que, debido a las derivadas en las condiciones de frontera, la matriz aumentó de tamaño a 
12 x 12, a diferencia del sistema de 9 x 9 de la ecuación (29.10), para considerar las tres temperatu- 
ras desconocidas del extremo inferior de la placa. De estas ecuaciones se obtiene 


T, =7191  T,=6701  T,=59.54 
T,=7281  T,=6831  T,=60.57 
T,=7601  T,=72.84  T,=6442 
T,=8341  T,=82.63  T,=74.26 


23 


Esos resultados y los flujos calculados (con los mismos parámetros que en el ejemplo 29.2) se 
muestran en la figura 29.8. Observe que, debido a que el extremo inferior está aislado, la temperatu- 
ra de la placa es más alta que en la figura 29.5, donde la temperatura del extremo inferior se fijó en 
cero. Además, el flujo de calor (a diferencia de la figura 29.6) ahora está desviado a la derecha y se 
mueve paralelamente a la pared aislada. 


29.3.2 Fronteras irregulares 


Aunque la placa rectangular de la figura 29.4 nos sirve para ilustrar los aspectos fundamentales en la 
solución de las EDP elípticas, muchos problemas de ingeniería no muestran esa geometría idealizada. 
Por ejemplo, muchos sistemas tienen fronteras irregulares (figura 29,9). 
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La figura 29.9 es un sistema útil para ilustrar cómo se pueden tratar las fronteras 
no rectangulares. Como se muestra, la frontera inferior izquierda de la placa es cir- 
cular. Observe que tenemos parámetros adicionales (a, %,, B,, $,) en cada una de las 
longitudes que rodean al nodo. Por supuesto que, para la placa mostrada en la figura 
29.9, a, =f,= 1. Conservaremos estos parámetros en la siguiente deducción, de tal 
modo que la ecuación resultante sea aplicable a cualquier frontera irregular (y no sólo 
a la esquina inferior izquierda de una placa caliente). Las primeras derivadas en la 
dimensión x se aproximan como sigue 


T IAN 
X yy ox (29.21) 
y 
T Tay To 
ES lil y * (29.22) Figura 29.9 


Malla de una placa caliente con una 
frontera en forma irregular. Observe 
cómo se utilizan los coeficientes pon- 
derados al considerar el espaciamiento 
no uniforme en la cercanía de la fron- 
E tera no rectangular. 


Las segundas derivadas se obtienen a partir de estas primeras derivadas. Para la di- 
mensión x, la segunda derivada es 


5= = —= (29.23) 


Sustituyendo las ecuaciones (29.21) y (29.22) en la (29.23), obtenemos 


Ta; LT. Deo - Ti 


Xx 


Agrupando términos, 


A E, Ma 


ij i+Lj ij 
2 2 HE 
Xx X ( ¡+ 2) A ¡+ 2) 


Es posible desarrollar una ecuación similar en la dimensión y: 


TA A T 


ij 
2 2 
y y ¡(+ 2) ¿Cat a) 


ya= Ej Doa 


Sustituyendo estas ecuaciones en la ecuación (29.6), obtenemos 


T, T, T, 


Ljtij + i++ ij 


2. q 


A ( ¡+ 2) Ad y 2) 


Tia, Tjri-T, 
+ 2 ij 8 e i,j+1 aj =0 (29.24) 


y ¡(r+ 2) a+ 2) 


Como se ilustra en el siguiente ejemplo, la ecuación (29.24) se aplica a cualquier nodo que sea ad- 
yacente a una frontera irregular de tipo Dirichlet. 
EJEMPLO 29.4 Placa caliente con una frontera irregular 


Planteamiento del problema Repita el mismo problema del ejemplo 29.1, pero ahora el extre- 
mo inferior tendrá la forma que se ilustra en la figura 29.9. 
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100”C 


83.93 $ 83.48 h 75.008 


75*C 77.234 75.00, 66.52, 
74.98 72.76 66.07 
o e e 
75C 
Figura 29.10 


Distribución de temperatura y flujo en una 


placa caliente con una frontera circular. 
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Solución En el caso de la figura 29.9, Ax= Ay, a, =fP, =0.732 y a,=P,=1. 
Sustituyendo estos valores en la ecuación (29.24), se obtiene la siguiente ecuación 
para el nodo (1, 1): 


0.788675(T,, —T,,) + 0.57735(T,, -T,) 


+ 0.788675(T,, —T,) +0.57735(T,, -T,) =0 


Agrupando términos, esta ecuación se expresa como 


-AT,, + 0.8453T,, + 0.84537,, =-1.1547T,, - 1.1547T,, 


Las ecuaciones simultáneas de la distribución de temperatura sobre la placa de 
la figura 29.9 con una temperatura en la frontera inferior de 75, se escriben en 
forma matricial como 


De estas ecuaciones se llega a 


T,,=74,98 
T,,=74.23 
T,, = 83.93 


Má  -0.845 -0.845 TY (173.2 

FT A 35] E, 75 

A 4 Sl E 125 

1 L El TE 75 

áj <i 4 el Sil To +=) 0 

El 14 la 50 

ed] 4 Te 175 

1 4 12: 100 

] l A A 150 
T,=72.76  T,=66.07 
T,,=75.00  T,=66.52 
T,,=83.48  T,=75.00 


Estos resultados, junto con los flujos calculados, se muestran en la figura 29.10. Observe que los 
flujos se calculan de la misma manera que en la sección 29.2.3, excepto que (a, + 4.,) y (P, + B,) se 
sustituyen por los 2 en los denominadores de las ecuaciones (29.14) y (29.15), respectivamente. En la 
sección 32.3 se ilustra cómo llevarlo a cabo. 


Las derivadas en las condiciones de frontera de forma irregular son 
más difíciles de formular. En la figura 29.11 se muestra un punto cercano 
a una frontera irregular donde se especifica la derivada normal. 

La derivada normal en el nodo 3 se aproxima por el gradiente entre 
los nodos 1 y 7, 


9T| _T-T, 
on 3 L, 


Cuando Ó es menor a 45%, como se muestra, la distancia del nodo 7 al 8 
es Ax tan 0, y se utiliza la interpolación lineal para estimar 


(29.25) 


Figura 29.11 
Frontera curvada donde se especifica el gradiente normal. 
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Ax tan O 
Ay 


T, = Tg+(1, 13) 


La longitud £,, es igual a Ax/cos 6. Esta longitud, junto con la aproximación para 7, puede sustituir- 
se en la ecuación (29.25) para obtener 


Ax joT Ax tan 0 Ax tan O 
T, = +T)|1 
cos O Jon Ay Ay 


Tal ecuación proporciona un medio para incorporar el gradiente normal en el método de diferen- 
cias finitas. En los casos donde O es mayor a 45", deberá usarse una ecuación diferente. La determi- 
nación de esta fórmula se deja como ejercicio para el lector. 


+T, (29.26) 
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29.4 EL MÉTODO DEL VOLUMEN DE CONTROL 


Para resumir, el método por diferencias finitas o series de Taylor divide al continuo en nodos (figu- 
ra 29.12a). La ecuación diferencial parcial correspondiente se escribe para cada uno de estos nodos. 
Las aproximaciones por diferencias finitas, entonces, se sustituyen por las derivadas para llevar las 
ecuaciones a una forma algebraica. 

Un procedimiento de esto es bastante simple y directo con mallas ortogonales (es decir, rectan- 
gulares) y coeficientes constantes. Sin embargo, este procedimiento se vuelve un poco más compli- 
cado cuando se tiene derivadas como condiciones de fronteras con forma irregular. 

En la figura 29.13 se muestra un ejemplo de un sistema donde se presentan dificultades adicio- 
nales. La placa está hecha de dos materiales diferentes y los espacios en la malla son distintos. 
Además, la mitad de su extremo superior está sujeta a transferencia de calor por convección; mientras 
que la otra mitad está aislada. Obtener las ecuaciones para el nodo (4, 2) requeriría algunas deduc- 
ciones adicionales, que van más allá de los métodos desarrollados hasta este punto. 

El método del volumen de control (también conocido como método del volumen integral) ofrece 
un camino alternativo para la aproximación numérica de las EDP, que es útil en casos como el de la 
figura 29.13. En la figura 29.12b, el método se parece a la aproximación por puntos, donde los puntos se 
determinan a través del dominio. No obstante, en lugar de aproximar la EDP en un punto, la aproxima- 
ción se aplica al volumen que rodea el punto. En una malla ortogonal, el volumen está formado por las 
rectas perpendiculares que pasan por el punto medio de cada línea que une nodos adyacentes. Un ba- 
lance de calor se obtiene después para cada volumen de manera similar a la ecuación (29.1). 


| 


Convección 
. . o O Aislada 
Az 
poca aa] 
¡ | 
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a) b) Material A Material B 
Figura 29.12 Figura 29.13 
Dos perspectivas diferentes para obtener soluciones aproximadas de Placa caliente con una malla de espaciamientos 
las EDP: a) Método por diferencias finitas punto por punto diferentes, dos materiales y diversas condiciones 


y b) Método del volumen de control. de frontera. 
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Como ejemplo, aplicaremos el método del volumen de control al nodo 
4,1 4,2 4,3 (4, 2). Primero, se define el volumen bisecando las rectas que unen los nodos. 
: O Ll E hd Como en la figura 29.14, el volumen tiene transferencia de calor por con- 
| ducción a través de sus fronteras izquierda, derecha e inferior, y la transfe- 
nh — —> “encia de cal ió ravés de la mitad d fr y 
| rencia de calor por convección a través de la mitad de su frontera superior. 
/ A | Observe que la transferencia por la frontera inferior comprende a ambos 
materiales. 
2/2 n/a Un balance de calor en estado estacionario para el volumen puede es- 
cribirse en términos cualitativos como 
312 no E ne 
0 conducción conducción conducción 
= = + 
. lado izquierdo lado derecho inferior material “a” 
Figura 29.14 q 
Volumen de control para el nodo (4, 2); las fle- conducción convección 
indi ¡ . ] : en : 29.27 
chas indican transferencia de calor a través de las alsormatenal*b superior (29.27) 


fronteras. 


Ahora el flujo por conducción se representa por la versión en diferencias 
finitas de la ley de Fourier. Por ejemplo, para el incremento de conducción 
en el lado izquierdo, sería 
Ti =T, 
a Kk 42 41 
q A 
donde las unidades de q son cal/cm?/s. Este flujo se debe multiplicar después por el área transversal a 
través de la cual entra (Az X h/2), para dar el flujo de calor que entra al volumen por unidad de tiempo, 
Tio = Ta A 
a k 42 ano Az 
0 co oh 2 
donde las unidades de O son cal/s. 
El flujo de calor debido a la convección se formula como sigue 


q ma hT, E E 15) 


donde h, =un coeficiente por calor de convección [cal/(s - cm? - *C)] y T, = temperatura del aire (*C). 
De nuevo, multiplicando por el área adecuada obtenemos la razón del flujo de calor por tiempo, 


h 
A 


Las otras transferencias se obtienen de manera similar y se sustituyen en la ecuación (29.27) 
para dar 


Ta Pad Ty Ta h 


h 2 h12 2 


(conducción lado izquierdo) (conducción lado derecho) 


Az 


0 =-k/ La, 


pe To Th O 
A 2 h 4 si 


Conducción j] Conducción 


Az—Kk; La 


inferior material “b” 


: ¿ a cid (Convección superior) 
inferior material “a 


Al sustituir los valores de los parámetros, obtenemos la ecuación final del balance de calor. Por 
ejemplo, si Az=0.5 cm, h= 10 cm, K = 0.3 cal/(s - cm - *C), K, = 0.5 cal/(s - cm - *C) y h,=0.1 cal/ 
(s - cm? - C), la ecuación se convierte en 


0.5875T,, — 0.075T,, —0.25T,, — 0.1375T,, = 2.5 
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Para hacer la ecuación comparable con el laplaciano estándar, ésta se multiplica por 4/0.5875, de 
modo que el coeficiente del nodo base tenga un coeficiente igual a 4, 


4T,, — 0.5106387,, — 1.7021287,, — 0.93617T,, = 17.02128 


En los casos estándar vistos hasta ahora, los métodos del volumen de control y de diferencias 
finitas punto por punto llegan a resultados idénticos. Por ejemplo, en el nodo (1, 1) de la figura 29.13, 
el balance sería 


T,-T, - T.-T = 
0O=-k/ => ES K/ => 2h az 2 A 
n n 1 


que se simplifica al laplaciano estándar, 


ys WT o To, LD, 3 ., > Do 
Veremos otros casos estándar (por ejemplo, la derivada en la condición de frontera) y exploraremos 
en detalle el método del volumen de control en los problemas del final de este capítulo. 


29.5 SOFTWARE PARA RESOLVER ECUACIONES ELÍPTICAS 


Modificar un programa computacional para incluir las derivadas en las condiciones de frontera para 
sistemas rectangulares es una tarea relativamente sencilla. Únicamente consiste en asegurar que se 
generan ecuaciones adicionales para caracterizar a los nodos frontera donde se especifican las deri- 
vadas. Además, hay que modificar el código de tal forma que estas ecuaciones incorporen la derivada 
como se indica en la ecuación (29.20). 

Desarrollar un software general que caracterice los sistemas con fronteras irregulares es mucho 
más difícil. Por ejemplo, se necesita un algoritmo bastante complicado para modelar la simple junta 
ilustrada en la figura 29.15. Esto significará dos grandes modificaciones. Primero, se tendrá que 
desarrollar un esquema para ingresar adecuadamente la configuración de los nodos e identificar los 
que estén en la frontera. Segundo, se necesitará un algoritmo para generar las ecuaciones simultáneas 
adecuadas, basándose en la información de entrada. El resultado final es que el software general 
para resolver las EDP elípticas (y, en general, todas) es relativamente complicado. 

Un método utilizado para simplificar este trabajo es proponer una malla muy fina. En tales 
casos, es frecuente suponer que los nodos cercanos sirven como puntos frontera. De esta manera, el 
análisis no tiene que considerar los parámetros ponderados de la sección 29.3.2. Aunque esto intro- 
duce cierto error, el uso de una malla suficientemente fina puede hacer despreciable la discrepancia 
resultante. Sin embargo, esto ocasiona una desventaja debido a la carga computacional introducida 
al aumentar el número de ecuaciones simultáneas. 

Como consecuencia de estas consideraciones, el 
análisis numérico ha desarrollado métodos alterna- 
tivos que difieren radicalmente de los métodos por 
diferencias finitas. Aunque estos métodos son con- 
ceptualmente más difíciles, pueden implementarse 
con mayor facilidad para las fronteras irregulares. 
En el capítulo 31 volveremos a estos métodos. Antes 
de hacerlo, sin embargo, describiremos los métodos 
por diferencias finitas en otra categoría de EDP: las 
ecuaciones parabólicas. 


Figura 29.15 
Una malla de diferencias finitas sobrepuesta a una 
junta de forma irregular. 
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PROBLEMAS 


29.1 Use el método de Liebmann para despejar la temperatura de la 
placa caliente cuadrada de la figura 29.4, pero con la condición de 
frontera superior aumentada a 150*C, y la frontera izquierda aislada. 
Use un factor de relajamiento de 1.2 e ¡tere hasta € = 1%. 

29.2 Use el método de Liebmann para resolver cuál sería la tempe- 
ratura de la placa cuadrada caliente que se ilustra en la figura 29.4, 
pero con la condición de frontera superior incrementada a 120? y la 
frontera izquierda disminuida a 60*C. Utilice un factor de relajamien- 
to de 1.2 para iterar a € =1%. 

29.3 Calcule los flujos para el problema 29.2 con el uso de los pa- 
rámetros del ejemplo 29.3. 

29.4 Repita el ejemplo 29.1, pero emplee 49 nodos interiores (es 
decir, Ax= Ay= 5 cm). 

29.5 Vuelva a hacer el problema 29.4, pero para el caso en que el 
extremo inferior está aislado. 

29.6 Repita los ejemplos 29.1 y 29.3, pero para el caso en que el 
flujo en el extremo inferior se dirige hacia abajo con un valor de 2 
cal/cm? - s. 

29.7 Repita el ejemplo 29.4 para el caso en que tanto las esquinas 
inferior izquierda y superior derecha están redondeadas en la misma 
forma que la esquina inferior izquierda de la figura 29.9. Observe 
que todas las temperaturas de la frontera en los lados superior y de- 
recho están fijas a 100%C, y todas las de los lados inferior e izquier- 
do lo están a 50”C. 

29.8 Con excepción de las condiciones de frontera, la placa de la 
figura P29.8 tiene las mismas características que la que se usó en los 
ejemplos 29.1 a 29.3. Para dicha placa, simule tanto las temperaturas 
como los flujos. 
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Figura P29.8 


29.9 Escriba ecuaciones para los nodos resaltados en la malla que se 
ilustra en la figura P29.9. Observe que todas las unidades son del 
sistema cgs. El coeficiente de conductividad térmica para la placa es 
de 0.75 cal/(s - cm - *C), el coeficiente de convección es h, = 0.015 
cal/(cm? - C - s), y el espesor de la placa es de 0.5 cm. 

29.10 Escriba ecuaciones para los nodos resaltados en la malla que 
aparece en la figura P29.10. Observe que todas las unidades son del 
sistema cgs. El coeficiente de convección es h,=0.01 cal/(cm? -C - s), 
y el espesor de la placa es de 2 cm. 


Convección, q, =-h AT, — T); T, = 10"C 


Ax=20 
j=3 
2 Ax=40 
mn Ay=30 
a AL £ 
> co 
o 2 la =15 Y A 2 
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Dirichlet, T= 100%C 


Fuente de calor, q. = 10 cal/cm”/s 


Figura P29.9 
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Figura P29.10 


29.11 Aplique el enfoque del volumen de control para desarrollar la 
ecuación para el nodo (0, ¿) de la figura 29.7. 

29.12 Deduzca una ecuación como la ecuación (29.26) en el caso 
donde O es mayor a 45” para la figura 29.11. 

29.13 Desarrolle un programa de computadora amigable para el 
usuario para implantar el método de Liebmann para una placa rec- 
tangular con condiciones de frontera de Dirichlet. Diseñe el programa 
de modo que calcule tanto la temperatura como el flujo. Pruebe el 
programa con la duplicación de los resultados de los ejemplos 29.1 
y 29.2. 

29.14 Emplee el programa del problema 29.13 para resolver los 
problemas 29.2 y 29.3. 

29.15 Utilice el programa del problema 29.13 para resolver el pro- 
blema 29.4. 

29.16 Emplee el enfoque del volumen de control y obtenga la ecua- 
ción de nodo para el nodo (2, 2) de la figura 29.13, e incluya una 
fuente de calor en este punto. Utilice los valores siguientes para las 
constantes: Az=0.25 cm, h= 10 cm, K, =0.25 W/cm - Cy ka = 0,45 
W/cm - C. La fuente calorífica sólo proviene del material A a una tasa 
de 6 W/cm*. 


29.17 Calcule el flujo de calor (W/cm?) en el nodo (2, 2) de la figu- 
ra 29.13, con aproximaciones por diferencias finitas para los gradien- 
tes de temperatura en dicho nodo. Calcule el flujo en dirección 
horizontal en los materiales A y B y determine si los dos flujos deben 
ser iguales. Asimismo, calcule el flujo vertical en los materiales A y 
B. ¿Deben ser iguales estos dos flujos? Utilice los valores siguientes 
para las constantes: Az = 0.5 cm, h = 10 cm, k, = 0.25 W/cm - C, k,, 
= 0.45 W/cm - C, y temperaturas en los nodos: T,, = 51.6%C, T,, = 
74.29€, T,, = 45.3%, T,, = 38.6%C y T, =87.4*C. 

29.18 Calcule la distribución de temperatura para la placa en forma 
de L de la figura P29.18. 

29.19 La ecuación de Poisson se puede escribir en tres dimensiones 
como 


9*T E deL ” 
0x2 dy? 0 
Despeje la distribución de temperatura dentro de un cubo unitario (1 


x 1) con condiciones de frontera cero y f=-10. Utilice Ax=Ay= Az 
= 1/6. 


?T 
3 =f,y0 
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Caliente 


Diferencias finitas: 
ecuaciones parabólicas 


En el capítulo anterior tratamos las EDP en estado estacionario. Ahora veremos las ecuaciones 
parabólicas que se emplean para caracterizar problemas que varían con el tiempo. En la última 
parte de este capítulo, ilustraremos cómo se desarrollan estos problemas en dos dimensiones espa- 
ciales para la placa calentada. Antes, mostraremos cómo se aborda el caso unidimensional más 
sencillo. 


30.1 LA ECUACIÓN DE CONDUCCIÓN DE CALOR 


De manera similar a la deducción de la ecuación de Laplace [ecuación (29.6)], se puede utilizar la 
conservación del calor para desarrollar un balance de calor del elemento diferencial, en la barra 
larga, delgada y aislada que se muestra en la figura 30.1. Sin embargo, en lugar de examinar el caso 
en estado estacionario, este balance también considera la cantidad de calor que se almacena en el 
elemento en un periodo Af. El balance tiene la forma, entradas — salidas = acumulación, O 


g(x) Ay Az At— q(x + Ax) Ay Az At= Ax Ay AzpC AT 


Dividiendo entre el volumen del elemento (= Ax Ay Az) y entre Af se obtiene 


q(x)-q(x+Ax) al 
Ax At 


Tomando el límite se llega a 


Sustituyendo la ley de Fourier para la conducción del calor [ecuación (29.4)] se obtiene 


YT _oT a 
aa diia 
que es la ecuación de conducción del calor. 

De la misma manera que con las EDP elípticas, las ecuaciones parabólicas se resuelven sus- 
tituyendo las derivadas parciales por diferencias divididas finitas. Sin embargo, a diferencia de 
las EDP elípticas, debemos considerar cambios tanto en el tiempo como en el espacio. Mientras 
que las ecuaciones elípticas están acotadas en todas las dimensiones, las EDP parabólicas están 
temporalmente abiertas en los extremos (figura 30.2). Debido a su naturaleza variable en el tiem- 
po, las soluciones de estas ecuaciones presentan problemas nuevos, notablemente relacionados con 


E:;í5CEoO Figura 30.1 


Frí y 
ñ Una barra delgada y aislada en todos los puntos excepto 


en sus extremos. 


30.2 Métodos explícitos 


Figura 30.2 —— . 
Una malla utilizada para la solución por diferencias EA A | 


finitas de las EDP parabólicas con dos variables inde- ——— 
pendientes, por ejemplo la ecuación de conducción 


del calor. Observe cómo, a diferencia de la figura 
29.3, la malla está abierta en los extremos de la di- 


mensión temporal. 


la estabilidad. Éste y otros aspectos de las EDP parabólicas se examinarán en las secciones si- 
guientes, donde presentamos fundamentalmente dos métodos de solución: los esquemas explícitos 
y los implícitos. 


30.2 MÉTODOS EXPLÍCITOS 


La ecuación de conducción del calor requiere aproximaciones de la segunda derivada en el espacio, 
y de la primera derivada en el tiempo. La segunda derivada se representa, de la misma manera que 
la ecuación de Laplace, mediante una diferencia dividida finita centrada: 
7 Ta RAT 
2 141 i ¿1 


2 2 
Xx Xx 


(30.2) 


que tiene un error (recuerde la figura 23.3) de O[(Ax)?]. Observe que el ligero cambio en la notación 
de los superíndices se utiliza para denotar tiempo. Esto se hace para que un segundo subíndice pue- 
da usarse para designar una segunda dimensión espacial cuando el método se extiende a dos dimen- 
siones espaciales. 

Una diferencia dividida finita hacia adelante sirve para aproximar a la derivada con respecto al 
tiempo 


T qpisl T! 
== 5 30.3 
t 1 ( ) 
la cual tiene un error (recuerde la figura 23.1) de O(A5). 
Sustituyendo las ecuaciones (30.2) y (30.3) en la ecuación (30.1), se obtiene 
T! TE An Te ¿el ll 
k i+1 5 i E T, (30.4) 
(x) t 
de donde resulta 
TH1=TI+AT 1, -2T!1+T1_1) (30.5) 


donde 4 = k At/(Ax?. 
Esta ecuación se puede escribir para todos los nodos interiores de la barra. Dicha ecuación 
proporciona un medio explícito para calcular los valores en cada nodo para un tiempo posterior, 


$ 

6 e + + + + . 

0,06 . * + . $ + 
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basándose en los valores presentes del nodo y de sus vecinos. 


E Punto de la malla usado en la diferencia temporal Observe que este método es una manifestación del método de 


Euler para resolver sistemas de EDO. Es decir, si conocemos la 


O Punto de la malla usado en la diferencia espacial distribución de temperatura como una función de la posición en 


un tiempo inicial, es posible calcular la distribución en un tiem- 
po futuro, basada en la ecuación (30.5). 


PE Una molécula computacional para el método explícito se 
1 


representa en la figura 30.3; ahí se muestran los nodos que cons- 
tituyen las aproximaciones espacial y temporal. Esta molécula se 
compara con otras de este capítulo para ilustrar las diferencias 


Figura 30.3 


A 
Ó ES E t entre los métodos. 


EJEMPLO 30.1 Solución explícita para la ecuación de 
conducción de calor unidimensional 


Molécula computacional para la forma explícita. 


Planteamiento del problema Con el método explícito cal- 

cule la distribución de temperatura en una barra larga y delgada 

que tiene una longitud de 10 cm y los siguientes valores: k” = 0,49 
cal/(s - cm + *C), Ax=2 cm y At=0.1 s. En 1=0, la temperatura de la barra es cero, y las condicio- 
nes de frontera se fijan para todos los tiempos en 7(0) = 100*C y 7(10) = 50*C. Considere que la 
barra es de aluminio con C = 0.2174 cal/(g * *C) y p =2.7 g/cm?. Por lo tanto, k = 0.49/(2.7 + 0.2174) 
= 0.835 cm?/s y A = 0.835(0.1)/(2)? = 0.020875. 


Solución Aplicando la ecuación (30.5) se obtiene el siguiente valor en £ = 0.1 s para el nodo en 
x=2cm: 


T!=0+0.020875[0 — 2(0) + 100] = 2.0875 
En los otros puntos interiores, x= 4, 6 y 8 cm, los resultados son 


T!=0+0.020875[0 —2(0)+0]=0 
T1=0+0.020875[0 — 2(0) +0] =0 
T!|=0+.0.020875[50 — 2(0) + 0] = 1.0438 


En f£= 0.2 s, los valores obtenidos para los cuatro nodos interiores son 


Ti =2.0875 + 0.020875[0 — 2(2.0875) + 100] = 4.0878 
T2=0+.0.020875[0 — 2(0) + 2.0875] = 0.043577 
T3=0+0.020875[1.0438 — 2(0) + 0] = 0.021788 

T3= 1.0438 + 0.020875[50 — 2(1.0438) + 0] = 2.0439 


El cálculo continúa y los resultados en intervalos de 3 segundos 
se ilustran en la figura 30.4. El aumento general de la temperatu- 
ra con el tiempo indica que el cálculo capta la difusión del calor 
desde las fronteras del interior de la barra. 


Figura 30.4 
Distribución de temperatura en una barra larga y delgada, calcula- 


da con el método explícito que se describe en la sección 30.2. 


x 
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30.2.1 Convergencia y estabilidad 


Convergencia significa que conforme Ax y Af tiendan a cero, los resultados de la técni- 
ca por diferencias finitas se aproximarán a la solución verdadera. Estabilidad significa 
que los errores en cualquier etapa del cálculo no se amplifican, sino que se atenúan 
conforme avanza el cálculo. Se puede demostrar (véase Carnahan y cols., 1969) que el 
método explícito es convergente y estable si A < 1/2, o 


2, 
MEE (30.6) 
2 k 


Además, se debe observar que cuando 4 < 1/2 se puede tener como resultado una solución 
donde los errores no crecen, sino que oscilan. Haciendo 4 < 1/4 asegura que la solución no 
oscilará. También se sabe que con 4 = 1/6 se tiende a minimizar los errores por trunca- 
miento (véase Carnahan y cols., 1969). 

La figura 30.5 es un ejemplo de inestabilidad causada al violar la ecuación (30.6). 
Esta gráfica es para el mismo caso del ejemplo 30.1, pero con 4 = 0.735, que es conside- 
rablemente mayor que 0.5. Como se advierte en la figura 30.5, la solución experimenta 
en forma progresiva mayores oscilaciones. Esta situación continuará conforme el cálcu- 
lo continúa. 

Aunque al satisfacer la ecuación (30.6) se disminuirían las inestabilidades del tipo 
mostrado en la figura 30.5, también impone fuertes limitaciones al método explícito. Por 
ejemplo, suponga que Ax se reduce a la mitad para mejorar la aproximación de la segun- 
da derivada espacial. De acuerdo con la ecuación (30.6) el tamaño de paso para el tiem- 
po debe reducirse a un cuarto para mantener la convergencia y la estabilidad. Así, para 
realizar cálculos comparables, el número de pasos debe aumentar por un factor de 4. Es 
más, el cálculo para cada uno de estos tamaños de paso del tiempo tomará el doble de 
tiempo, ya que al dividir Ax a la mitad se duplica el número total de nodos para los 
cuales hay que aplicar las ecuaciones. En consecuencia, en el caso unidimensional, re- 
ducir Ax a la mitad da como resultado un aumento de ocho veces en el número de cálculos. 
Así, la carga computacional puede resultar tan grande que impida alcanzar una exactitud 
aceptable. Como describiremos en breve, hay otras técnicas que no adolecen de limitan- 
tes tan severas. 


30.2.2 La derivada en las condiciones de frontera 


Como en el caso de las EDP elípticas (recuerde la sección 29.3.1), la derivada en las 
condiciones de frontera se puede incorporar fácilmente a las ecuaciones parabólicas. 
Para una barra unidimensional, se necesita agregar dos ecuaciones para caracterizar el 
balance de calor en los nodos extremos. Por ejemplo, el nodo del extremo izquierdo (i = 0) 
se representará por 


TY =T +A(T!-2T/+T1,) 


TA t=6 
Xx 
Xx 

TA t=18 
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Xx 
Xx 
Xx 


Figura 30.5 

Ilustración de la inestabilidad. Solu- 
ción del ejemplo 30.1, pero con 

4 =0.735. 


Así, se introdujo un punto imaginario en ¡ = —1 (recuerde la figura 29.7). Sin embargo, como en el 
caso elíptico, este punto ofrece un medio para incorporar en el análisis la derivada en las condiciones 


de frontera. El problema 30.2, que está al final de este capítulo, se ocupa de este ejercicio. 


30.2.3 Aproximaciones temporales de orden superior 


La idea general de volver a expresar la EDP como un sistema de EDO se denomina método de líneas. 
En efecto, una manera de mejorar el método de Euler usado antes, sería emplear un esquema de inte- 
gración más exacto para resolver las EDO. Por ejemplo, el método de Heun puede utilizarse para 
obtener una exactitud temporal de segundo orden. Esta aproximación se conoce como método de 
MacCormack. Éste y otros métodos explícitos mejorados se analizan en obras como, por ejemplo, la 


de Hoffmann (1992). 
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30.3 UN MÉTODO IMPLÍCITO SIMPLE 


Como ya se indicó, las formulaciones explícitas por diferencias finitas tienen problemas relacionados 
con la estabilidad. Además, como se ilustra en la figura 30.6, excluyen información de importancia 
para la solución. Los métodos implícitos superan ambas dificultades a expensas de utilizar algoritmos 


un poco más complicados. 


La diferencia fundamental entre los métodos explícitos y los implícitos se ilustra en la figura 
30.7. En la forma explícita, aproximamos la derivada espacial para un nivel de tiempo ! (figura 30.7a). 
Recuerde que cuando sustituimos esta aproximación en la ecuación diferencial parcial, obtuvimos 
una ecuación en diferencias (30.4) con una sola incógnita T |*!. Así, podemos despejar “explícita- 
mente” esta incógnita como en la ecuación (30.5). 

En los métodos implícitos, la derivada espacial se aproxima en un nivel de tiempo posterior /+ 1. 
Por ejemplo, la segunda derivada se aproximará mediante (figura 30.7b) 


27 a A Es Ue 


+1 


% 


x” (xy 


(30.7) 


que tiene una exactitud de segundo orden. Cuando esta relación se sustituye en la EDP original, la 
ecuación en diferencias resultante contiene varias incógnitas. Así, no puede resolverse explícitamen- 


Condición inicial 


Figura 30.6 


Representación del efecto de los otros nodos sobre la aproximación por 


diferencias finitas en el nodo (1, /) usando un esquema explícito 


por diferencias finitas. Los nodos marcados tienen una influencia sobre 


(í, h); en tanto que los nodos no marcados, que en realidad afectan 
a (i, ), se han excluido. 


> Puntos de la malla usados en la diferencia temporal 


O Puntos de la malla usados en la diferencia espacial 


1+1 | 1+1 


i-1 i 1 i-1 i i+1 


a) Explícito b) Implícito 


te mediante simples manipulaciones algebraicas, como 
se hizo al pasar de la ecuación (30.4) a la (30.5). En 
lugar de esto, el sistema completo de ecuaciones debe 
resolverse simultáneamente. Esto es posible debido a 
que, junto con las condiciones de frontera, las formu- 
laciones implícitas dan como resultado un conjunto de 
ecuaciones lineales algebraicas con el mismo número 
de incógnitas. Por lo tanto, el método se reduce a la 
solución de un sistema de ecuaciones simultáneas en 
cada punto en el tiempo. 

Para ilustrar cómo hacer lo anterior, sustituimos 
las ecuaciones (30.3) y (30.7) en la ecuación (30.1), para 
obtener 


LE EA, E TE 
(a t 


que se expresa como 


ATRIL (A2M)TAIA TI =T! 60) 


donde A = k A:r/(AxY?. Esta ecuación se aplica a todos 
los nodos, excepto al primero y al último de los nodos 
interiores, los cuales deben modificarse para conside- 
rar las condiciones de frontera. En el caso donde están 
dados los niveles de temperatura en los extremos de la 
barra, la condición de frontera en el extremo izquierdo 
de la barra (i = 0) se expresa como 


Ty = fe t*») (30.9) 


donde fy(1'**) = una función que describe cómo cambia 
con el tiempo la temperatura de la frontera. Sustituyen- 


Figura 30.7 
Moléculas computacionales que demuestran las dife- 
rencias fundamentales entre los métodos a) explícito 
y b) implícito. 


30.3 Un método implícito simple 


do la ecuación (30.9) en la ecuación (30.8), se obtiene la ecuación en diferencias para el primer nodo 
interior (1 = 1): 

(+ 2OTIAA TA = Tf) (30.10) 
De manera similar, para el último nodo interior (i =m), 

AT o AO E MT A = T Ai 172) (30.11) 
donde f,, , ¡(++ ') describe los cambios específicos de temperatura en el extremo derecho de la barra 
(¡=m+ 1). 

Cuando se escriben las ecuaciones (30.8), (30.10) y (30.11) para todos los nodos interiores, el 
conjunto resultante de m ecuaciones algebraicas lineales tiene m incógnitas. Además, el método 


tiene la ventaja de que el sistema es tridiagonal. Así, es posible utilizar los algoritmos de solución 
extremadamente eficientes (recuerde la sección 11.1.1) disponibles para sistemas tridiagonales. 


EJEMPLO 30.2 Solución implícita simple de la ecuación de conducción del calor 


Planteamiento del problema Con la aproximación por diferencias finitas implícita simple 
resuelva el problema del ejemplo 30.1. 


Solución Para la barra del ejemplo 30.1, 4 = 0.020875. Por lo tanto, en £= 0, la ecuación (30.10) 
para el primer nodo interior se escribe como 
1.04175T | -—0.020875T )=0+0.020875(100) o 1.04175T !-—0.020875T ) = 2.0875 


De manera similar, las ecuaciones (30.8) y (30.11) pueden aplicarse a los otros nodos interiores. Esto 
nos conduce al siguiente sistema de ecuaciones simultáneas: 


1.04175 — -0.020875 TI] (2.0875 
-0.020875  1.04175  -0.020875 3 O 
-0.020875  1.04175  -—0.020875||T![ | 0 


-0.020875  1.04175 ||T, 1.04375 


que se resuelve para la temperatura en £=0.1 s: 


T!=2.0047 
T!=0.0406 
T!=0.0209 
T!= 1.0023 


Observe cómo, a diferencia del ejemplo 30.1, todos los puntos se han modificado de la condición 
inicial durante el primer paso de tiempo. 

Al resolverlas para temperaturas en f£ = 0.2, el vector del lado derecho debe modificarse consi- 
derando los resultados del primer paso, así 


4.09215 
0.04059 
0.02090 
2.04069 


Entonces, de las ecuaciones simultáneas se obtienen las temperaturas en £=0.2 s: 


T?=3.9305 
T2=0.1190 
T3=0.0618 


T2= 1.9653 
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e Punto de la malla usado en la diferencia e Punto de la malla usado en la diferencia 
temporal temporal 
a Punto de la malla usado en la diferencia O Punto de la malla usado en la diferencia 
espacial espacial 
e PP 0 
dE ¿a 
y PL Q—" 
Xi-1 X; Xi+1 *;-1 Xi Xi+1 
Figura 30.8 Figura 30.9 
Una molécula computacional para el método Molécula computacional para el método de 
implícito simple. Crank-Nicolson. 


Mientras que el método implícito descrito es estable y convergente, es deficiente en el sentido 
de que la aproximación en diferencias temporal tiene una exactitud de primer orden; en tanto que la 
aproximación en diferencias espacial tiene exactitud de segundo orden (figura 30.8). En la siguiente 
sección presentaremos un método implícito alternativo que resuelve esta situación. 

Antes de continuar, hay que mencionar que, aunque el método implícito simple es incondicio- 
nalmente estable, hay un límite de exactitud para el uso de pasos de tiempo grandes. En consecuen- 
cia, no es mucho más eficiente que los métodos explícitos para la mayoría de los problemas variables 
en el tiempo. 

Donde se nota esto es en los problemas en estado estacionario. Del capítulo 29 recuerde que una 
forma de Gauss-Seidel (método de Liebmann) se utiliza para obtener soluciones para estado estacio- 
nario de las ecuaciones elípticas. Un método alternativo será correr una solución variable en el 
tiempo hasta que alcance un estado estacionario. En estos casos, debido a que los resultados inter- 
medios inexactos no son un problema, los métodos implícitos permiten emplear grandes pasos de 
tiempo, y así generar resultados a estado estacionario de manera eficiente. 


30.4 EL MÉTODO DE CRANK-NICOLSON 


El método de Crank-Nicolson ofrece un esquema implícito alternativo que tiene una exactitud de 
segundo orden, tanto para el espacio como para el tiempo. Para alcanzar tal exactitud, se desarrollan 


aproximaciones por diferencias en el punto medio del incremento del tiempo (figura 30.9). Entonces, 
¿eZ 


la primera derivada temporal se aproxima en por 
1+1 1 
E E (30.12) 
Í Í 


La segunda derivada en el espacio puede determinarse en el punto medio promediando las aproxi- 

maciones por diferencias al principio (1) y al final (++!) del incremento del tiempo 
7 A A A AN 

+ 


22 ($ y 


(30.13) 


Sustituyendo las ecuaciones (30.12) y (30.13) en la ecuación (30.1) y reagrupando términos, se 
obtiene 


TA +2(1+ E Ti ET +20 DE+ Tía (30.14) 


donde 4 = k At/(AxY?. Como en el caso del método implícito simple, se determinan las condiciones de 
frontera Ty = (0) y TH = f, 4 (4*”) para obtener versiones de la ecuación (30.14) para los nodos 
interiores primero y último. Para el primer nodo interior 


30.4 El método de Crank-Nicolson 


21 +47 +1 475! = A 0) +21 DT + AT HA (0+L) (30.15) 
y, para el último nodo interior, 
Ta FROA JS Dal. TER TA Tal”) (30.16) 


Aunque las ecuaciones (30.14) a (30.16) son ligeramente más complicadas que las ecuaciones 
(30.8), (30.10) y (30.11), también son tridiagonales y, por lo tanto, se resuelve de manera eficiente. 


EJEMPLO 30.3 Solución de Crank-Nicolson para la ecuación de conducción del calor 


Planteamiento del problema Con el método de Crank-Nicolson resuelva el mismo problema 
que en los ejemplos 30.1 y 30.2. 


Solución Las ecuaciones (30.14) a (30.16) se utilizan para generar el siguiente sistema de ecua- 
ciones tridiagonal: 


2.04175  —0.020875 ed 4.175 
-0.20875  2.04175  —0.020875 dE 0 

-0.020875  2.04175  —0.020875 

-0.020875  2.04175 ||T; 2.0875 


So 
o 


de donde se obtienen las temperaturas en 1=0.1 s: 


T! =2.0450 
T) =0.0210 
T! =0.0107 
T| = 1.0225 


Para obtener las temperaturas en £ = 0.2 s, el vector del lado derecho debe modificarse 


8.1801 
0.0841 
0.0427 
4.0901 


De las ecuaciones simultáneas se obtiene 


T?= 4.0073 
T3 =0.0826 
T23= 0.0422 
T?=2.0036 


30.4.1 Comparación de los métodos unidimensionales 


La ecuación (30.1) se puede resolver en forma analítica. Por ejemplo, hay una solución para el caso 
donde la temperatura de la barra es inicialmente cero. En 1 = 0, la condición de frontera en x = L se 
eleva instantáneamente a un nivel constante de T, mientras que T(0) se mantiene en cero. En este 
caso, la temperatura se calcula por 


ZHx YE 2 nx ak 
T=T|“%+ 1)"sen ex 30.17 
E 2, a (5) y 7 ] (30.17) 
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donde £L = longitud total de la barra. Esta ecuación es útil para calcular la evolución de la distribución 
de temperaturas para cada condición de frontera. Entonces, la solución total se determina por super- 
posición. 


EJEMPLO 30.4 Comparación de las soluciones numéricas y analíticas 


Planteamiento del problema Compare la solución analítica de la ecuación (30.17) con los 
resultados numéricos obtenidos con las técnicas explícita, implícita simple y de Crank-Nicolson. 
Realice esta comparación con la barra empleada en los ejemplos 30.1, 30.2 y 30.3. 


Solución Recuerde de los ejemplos anteriores que k = 0.835 cm?/s, L = 10 cm y Ax=2 cm. En 
este caso, se utiliza la ecuación (30.17) para predecir que la temperatura en x=2 cm y £=10 s será 
igual a 64.8018. En la tabla 30.1 se presentan predicciones numéricas para 7(2, 10). Observe que se 
ha empleado un tamaño de paso para el tiempo. Estos resultados indican varias propiedades de los 
métodos numéricos. Primero, se observa que el método explícito es inestable para 4 alta. Dicha 
inestabilidad no se manifiesta en ningún método implícito. Segundo, el método de Crank-Nicolson 
converge más rápidamente conforme 4 decrece, y proporciona resultados de exactitud moderada aun 
cuando 4 sea relativamente alta. Estos resultados eran de esperarse ya que Crank-Nicolson tiene una 
exactitud de segundo orden con respecto a ambas variables independientes. Por último, observe que 
conforme 4 decrece, los métodos parecen converger a un valor de 64.73, que es diferente del resul- 
tado analítico de 64.80. Esto no debe sorprender, ya que se ha usado un valor fijo de Ax = 2 para 
caracterizar la dimensión x. Si tanto Ax como Af disminuyeran conforme A decrece (es decir, si se 
usaran más segmentos espaciales), la solución numérica se acercará más al resultado analítico. 


Tabla 30.1 Comparación de tres métodos para la solución de una EDP parabólica: la barra 
calentada. Los resultados mostrados corresponden a la temperatura en t= 10s 
en x= 2 cm para la barra de los ejemplos 30.1 a 30.3. Observe que la solución 
analítica es 7(2, 10) = 64.8018. 


At 2 Explícito Implícito Crank-Nicolson 
10 2.0875 208.75 53.01 79.77 

5 1.04375 -9.13 58.49 64.79 

2 0.4175 67.12 62.22 64.87 

1 0.20875 65.91 63.49 64.77 

0.5 0.104375 65.33 64.12 64.74 


0.2 0.04175 64.97 64.49 64.73 


El método de Crank-Nicolson se emplea con frecuencia para resolver EDP parabólicas en una 
dimensión espacial. Las ventajas del método se aprecian cuando se presentan problemas más com- 
plicados, como aquellos en los que se tienen mallas irregularmente espaciadas. Tal espaciado no 
uniforme a menudo es ventajoso cuando se tiene un conocimiento previo de que la solución varía 
rápidamente en porciones locales del sistema. Análisis de tales aplicaciones y del método de Crank- 
Nicolson se encuentran en diferentes fuentes (Ferziger, 1981; Lapidus y Pinder, 1981; Hoffman, 1992). 


30.5 ECUACIONES PARABÓLICAS EN DOS DIMENSIONES ESPACIALES 


La ecuación de conducción del calor se puede aplicar a más de una dimensión espacial. Para dos di- 
mensiones, su forma es 


(30.18) 


30.5 Ecuaciones parabólicas en dos dimensiones espaciales 


Una aplicación de esta ecuación consiste en modelar la distribución de temperatura sobre la super- 
ficie de una placa calentada. Sin embargo, más que caracterizar su distribución en estado estaciona- 
rio, como se hizo en el capítulo 29, la ecuación (30.18) ofrece un medio para calcular la distribución 
de temperatura de la placa conforme cambia con el tiempo. 


30.5.1 Esquemas explícito o implícito estándar 


Es posible obtener una solución explícita sustituyendo en la ecuación (30.18) las aproximaciones por 
diferencias finitas de la forma de las ecuaciones (30.2) y (30.3). Sin embargo, como en el caso uni- 
dimensional, este método está limitado por un estricto criterio de estabilidad. En el caso bidimen- 
sional, el criterio es 


2 2 
aro LA? + (Ay) 
8 k 


Así, para una malla uniforme (Ax = Ay), 4 = k At/(AxY? debe ser menor o igual que 1/4. En consecuen- 
cia, si se reduce a la mitad, el tamaño del paso, se cuadruplica el número de nodos y aumenta el 
trabajo computacional en un factor de 16. 

Como en el caso de sistemas unidimensionales, las técnicas implícitas ofrecen alternativas que 
garantizan estabilidad. Sin embargo, la aplicación directa de los métodos implícitos, como la técnica 
de Crank-Nicolson, nos lleva a la solución de mx n ecuaciones simultáneas. Además, cuando se aplican 
para dos o tres dimensiones espaciales, estas ecuaciones pierden la valiosa propiedad de ser tridiago- 
nales. De esta manera, el almacenamiento de la matriz y el tiempo de cálculo llegan a ser extremada- 
mente grandes. El método descrito en la siguiente sección ofrece una manera de resolver esta 
disyuntiva. 


30.5.2 El esquema IDA 


El esquema implícito de dirección alternante, o esquema IDA, proporciona un medio para resolver 
ecuaciones parabólicas en dos dimensiones espaciales usando matrices tridiagonales. Para ello, cada 
incremento de tiempo se ejecuta en dos pasos (figura 30.10). En el primero, la ecuación (30.18) se 
aproxima mediante 


e Explícito 
O Implícito 


-pi+l 


i-1 i 1+1 
Jj A 2225 222292 >= === ==> ===> == >>=+ pl 
sil 
*Xi-1 *; Xi+1 
a) Primer medio paso b) Segundo medio paso 
Figura 30.10 


Los dos medios pasos usados en la implementación del esquema implícito de dirección alternante para 
resolver ecuaciones parabólicas en dos dimensiones espaciales. 
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qua T! T! 


ij e O k i+1j A il, ij+l 


112 Car (yr 


dE ly ido yA Sl 


Ep 1 


(30.19) 


Así, la aproximación de 9?7/dx? se escribe explícitamente (es decir, en el punto base f!, donde se 

conocen los valores de la temperatura). En consecuencia, sólo se desconocen tres términos de la 

temperatura en la aproximación de 9T/dy?. En el caso de una malla cuadrada (Ay = Ax), esta ecuación 
se expresa como 

1+1/2 1+1/2 1+1/2 1 1 1 

E +A Bja = Li E, E 


rd i,j+1 i+1,)j 


(30.20) 


que, cuando se escribe para el sistema, da como resultado un sistema tridiagonal de ecuaciones si- 
multáneas. 

En el segundo paso, que va desde 1!*!? hasta £!+!, la ecuación (30.18) se aproxima por 
A O o me 
112 Cay (Cy 


A diferencia de la ecuación (30.19), la aproximación de 9?7/dx? es ahora implícita. Así, el sesgo in- 
troducido por la ecuación (30.19) se corregirá parcialmente. Para una malla cuadrada, la ecuación 
(30.21) se escribe como 

Tn +2(1+ E par == pa +21 red Je qa (30.22) 


i +1, 7 ij 1 ¿joel 


De nuevo, cuando se escribe para una malla bidimensional, la ecuación da como resultado un siste- 
ma tridiagonal (figura 30.11). Como en el siguiente ejemplo, esto nos lleva a una solución numérica 
eficiente. 


EJEMPLO 30.5 Método IDA 


Planteamiento del problema Utilice el método IDA para encontrar la temperatura de la placa 
de los ejemplos 29.1 y 29.2. En £ = 0, suponga que la temperatura de la placa es cero y que las tem- 
peraturas en la frontera se llevan instantáneamente a los niveles que se muestran en la figura 29.4. 
Emplee un tamaño de paso para el tiempo de 10 s. Recuerde del ejemplo 30.1 que el coeficiente de 
difusividad térmica para el aluminio es k = 0.835 cm?/s. 


Solución Se empleó un valor de Ax = 10 cm para caracterizar la placa de 40 x 40 cm de los ejem- 
plos 29.1 y 29.2. Por lo tanto, 4 = 0.835(10)/(10) = 0.0835. En el primer paso en t= 5 (figura 30.11a), 
la ecuación (30.20) se aplica a los nodos (1, 1), (1, 2) y 
(1, 3), que conducen a las siguientes ecuaciones tridia- 


sl (22 (=3 i=sl ¿=2 i=) gonales: 
IN 2.167 0.0835 T 6.2625 
I I 
: -—__— e 0.0835 2.167  —0.0835 |37,,y=3 6.2625 
i aa » 0.0835 2.167 ||7,5 14.6125 
l l 1: —— > — 
SE CA . 
I I )) 
| ——— A > — 
RIAS Figura 30.11 
El método IDA da como resultado ecuaciones tridiago- 
a) Primera dirección b) Segunda dirección nales solamente si se aplica a lo largo de la dimensión 


que es implícita. En el primer paso a), se aplica a lo lar- 
go de la dimensión y; en el segundo paso b), a lo largo 
de la dimensión x. Estas “direcciones alternantes” 

son la razón del nombre del método. 


Figura 30.12 
Solución para la placa calentada del 


60.76 52.57 53.02 
o . O 


41.09 27.20 31.94 
e . e 


28.56 14.57 20.73 
e e e 


Problemas 


72.82 68.17 64.12 
e e e 


55.26 45.32 44.86 
e e e 


37.40 25.72 28.69 
e e e 
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76.54 73.29 67.68 
e e e 


60.30 52.25 49.67 
e O O 


40.82 30.43 31.96 
e e e 


ejemplo 30.5 en a)t=100s, b)t=200 s 


y C)t=300s. 
a)t=100s b)t=200s c)1=300s 
de las cuales se obtiene 
Ti = 3.01597 Tia = 3.2708 Ti3 = 6.8692 


De manera similar, se pueden desarrollar ecuaciones tridiagonales para encontrar 


T,1=0,1274  T,,=0.2900  T,¿=4.1291 


T,¡=2.0181.  T,,=2.2477  T,,=6.0256 


En el segundo paso en £ = 10 (figura 30.11b), la ecuación (30.22) se aplica a los nodos (1, 1), 
Q, 1D y G, 1) para llegar a 


2.167 0.0835 TD 12.0639 
0.0835 2.167 0.0835 |47T,, p=x3 0.2577 
0.0835 2.167 ||T,, 8.0619 
para obtener 
T,  =5.5855 T> ¡ = 0.4782 T;  = 3.7388 


Ecuaciones tridiagonales para los otros renglones se desarrollan para llegar al siguiente resultado: 


T¡,=6.1683  T,,=0.8238  T,,=4.2359 


T,,=13.1120  T,,=8.3207  T,,=11.3606 


El cálculo puede repetirse, y los resultados para £ = 100, 200 y 300 s se ilustran en las figuras 
30.12a a 30.12c. Como se esperaba, la temperatura de la placa aumenta. Después de un espacio de 
tiempo suficiente, la temperatura se aproximará a la distribución en estado estacionario de la figura 
29.5. 


El método IDA es una de las técnicas de un grupo conocido como métodos de división. Algunos 
de éstos representan mejoras que evitan las desventajas del IDA. En muchas referencias se encuentran 
análisis de otros métodos de división, así como mayor información sobre el IDA (Ferziger, 1981; 
Lapidus y Pinder, 1981). 


PROBLEMAS 


30.1 Repita el ejemplo 30.1, pero utilice el método del punto medio 30.3 a) Repita el ejemplo 30.1, pero para un tiempo de paso Af = 
para generar su solución. 0.05 s. Compare los resultados con £ = 0.2. b) Además, realice el 
30.2 Repita el ejemplo 30.1, pero para el caso en que la barra está mismo cálculo con el método de Heun (sin iteración del corrector) 
inicialmente a 50*C y la derivada en x=0 es igual a l yenx=10€es con un tamaño de paso mucho más pequeño, de Af= 0.001 s. Supon- 
igual a O. Interprete sus resultados. ga que los resultados del inciso b) son una aproximación válida de la 
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solución verdadera, y determine los errores relativos porcentuales 
para los resultados obtenidos en el ejemplo 30.1, así como para el 
inciso a). 

30.4 Repita el ejemplo 30.2, pero para el caso en que la derivada en 
x=10es igual a cero. 

30.5 Repita el ejemplo 30.3, pero para Ax=1 cm. 

30.6 Repita el ejemplo 30.5, pero para la placa descrita en el proble- 
ma 29.2. 

30.7 La ecuación de advección-difusión se utiliza para calcular la 
distribución de la concentración que hay en el lado largo de un reac- 
tor químico rectangular (véase la sección 32.1), 


donde c = concentración (mg/m?), f = tiempo (min), D = coeficiente 
de difusión (m?/min), x = distancia a lo largo del eje longitudinal del 
tanque (m), donde x = 0 en la entrada del tanque, U = velocidad en 
la dirección x (m/min) y k = tasa de reacción (min”') con la que el 
producto químico se convierte en otro. Desarrolle un esquema explí- 
cito para resolver esta ecuación en forma numérica. Pruébela para 
k=0.15, D=100 y U= 1, para un tanque con una longitud de 10 m. 
Use Ax = 1 m, y un tamaño de paso Af = 0.005. Suponga que la 
concentración del flujo de entrada es de 100 y la concentración inicial 
en el tanque es de cero. Realice la simulación de 1=0 a 100 y grafi- 
que las concentraciones finales resultantes versus x. 

30.8 Desarrolle un programa de cómputo amigable con el usuario 
para el método explícito simple de la sección 30.2. Pruébelo con la 
duplicación del ejemplo 30.1. 

30.9 Modifique el programa del problema 30.8 de modo que emplee 
ya sea las condiciones de frontera de Dirichlet o derivadas. Pruébelo 
con la solución del problema 30.2. 

30.10 Haga un programa de computadora amigable con el usuario 
para implantar el esquema implícito simple de la sección 30.3. Prué- 
belo con la duplicación del ejemplo 30.2. 

30.11 Elabore un programa de computadora amigable con el usuario 
para implantar el método de Crank-Nicolson de la sección 30.4. 
Pruébelo con la duplicación del ejemplo 30.3. 

30.12 Desarrolle un programa amigable con el usuario para el mé- 
todo IDA descrito en la sección 30.5. Pruébelo con la duplicación del 
ejemplo 30.5. 

30.13 La forma no dimensional para la conducción de calor transi- 
tiva en una barra aislada (ecuación 30.1) se escribe como 


du _ du 
ox” or 
donde el espacio, tiempo y temperatura no dimensionales, se definen 


como 


x T 


a P= = o 


ja (PCE) "TT 


donde £ = longitud de la barra, k = conductividad térmica del mate- 
rial de la barra, p = densidad, C = calor específico, T, = temperatura 
en x=0 y T, = temperatura en x = L. Esto opera para las siguientes 
condiciones iniciales y de frontera: 


Condiciones de frontera 


Condiciones iniciales 


Capítulo 30 Diferencias finitas: ecuaciones parabólicas 


Resuelva esta ecuación no dimensional para la distribución de la 
temperatura con los métodos de diferencias finitas y de Crank-Nicol- 
son con una formulación exacta de segundo orden, para integrar en 
el tiempo. Escriba un programa de cómputo para obtener la solución. 
Incremente el valor de Af en 10% para cada paso de tiempo para 
obtener con más rapidez la solución de estado estable, y seleccione 
valores de Ax y Af para una exactitud buena. Grafique la temperatu- 
ra no dimensional versus la longitud no dimensional para distintos 
valores de tiempos no dimensionales. 

30.14 El problema del flujo de calor radial transitivo en una barra 
circular en forma no dimensional, está descrita por 


Pu, 10u_du 
ar? For 0 
Condiciones de frontera u(1,f)=1 0) =0 
T 
u(x, 0)=0 O<Xx<1! 


Condiciones iniciales 


Resuelva la ecuación de conducción de calor radial transitiva no di- 
mensional en una barra circular para la distribución de temperatura 
en distintos tiempos conforme la temperatura de la barra se aproxima 
al estado estable. Utilice análogos de diferencias finitas exactas de 
segundo orden para las derivadas, con una formulación de Crank- 
Nicolson. Escriba un programa de computadora para la solución. 
Seleccione valores de Ar y Af para una exactitud buena. Grafique la 
temperatura u versus el radio F para distintos tiempos ?. 

30.15 Resuelva la siguiente EDP: 


%u du du 
0 da 0 
ox" dx ot 
Condiciones de frontera u(0,t)=0 u(1,0=1 
Condiciones iniciales u(x, 0)=0 O<x<1 


Utilice análogos de diferencias finitas exactas de segundo orden para 
las derivadas, con una formulación de Crank-Nicolson, a fin de inte- 
grar en el tiempo. Escriba un programa de cómputo para obtener la 
solución. Incremente el valor de Aten 10% para cada paso de tiempo 
a fin de obtener más rápido la solución de estado estable, y seleccio- 
ne valores de Ax y Af para una buena exactitud. Grafique u versus x 
para valores distintos de f. Resuelva para los valores de b = 4, 2, 0, 
2, 4. 

30.16 Determine las temperaturas a lo largo de una barra horizontal 
de 1 m, descritas por la ecuación de conducción del calor [ecuación 
(30.1)]. Suponga que la frontera derecha está aislada y que la izquier- 
da (x = 0) está representada por 


cd 


=hMT, -T, 
dx E ( a 0) 


donde k” = coeficiente de conductividad térmica (W/m - *C), 
h = coeficiente de transferencia de calor convectivo (W/m? - *C), T, 
= temperatura ambiente (*C) y T, = temperatura de la barra en x=0 
(*C). Resuelva cuál sería la temperatura como función del tiempo con 
el uso de un paso espacial de Ax = 1 cm y los siguientes valores de 
parámetros: k=2 x 107 m?/s, k* = 10 W/m - *C, h=25 W/m? - *C, 
y T, = 50 *C. Suponga que la temperatura inicial de la barra es cero. 


UNS AA 


Método del elemento finito 


Hasta aquí hemos empleado métodos por diferencias finitas para resolver ecuaciones diferenciales 
parciales. En estos métodos, el dominio de la solución se divide en una malla con puntos discretos 
o nodos (figura 31.1b). Entonces, se aplica la EDP en cada nodo, donde las derivadas parciales se 
reemplazan por diferencias finitas divididas. Aunque tal aproximación por puntos es conceptual- 
mente fácil de entender, tiene varias desventajas. En particular, es difícil de aplicar a sistemas con 
una geometría irregular, con condiciones de frontera no usuales o de composición heterogénea. 

El método del elemento finito ofrece una alternativa que es más adecuada para tales sistemas. 
A diferencia de las técnicas por diferencias finitas, la técnica del elemento finito divide el dominio 
de la solución en regiones con formas sencillas o “elementos” (figura 31.1c). Se puede desarrollar 
una solución aproximada de la EDP para cada uno de estos elementos. La solución total se genera 
uniendo, o “ensamblando”, las soluciones individuales, teniendo cuidado de asegurar la continuidad 
de las fronteras entre los elementos. De este modo, la EDP se satisface por secciones. 

Como se observa en la figura 31.1c, el uso de elementos, en lugar de una malla rectangular, 
proporciona una mejor aproximación para sistemas con forma irregular. Además, se pueden generar 
continuamente valores de las incógnitas a través de todo el dominio de la solución en lugar de pun- 
tos aislados. 

Debido a que una descripción completa va más allá del alcance de este libro, el presente capí- 
tulo ofrece sólo una introducción general al método del elemento finito. Nuestro objetivo principal 
es familiarizar al lector con esta técnica y darle a conocer sus capacidades. Por lo tanto, la siguien- 
te sección ofrece una visión general de los pasos para la solución de un problema, usando el elemen- 
to finito. Después se analizará un ejemplo sencillo: una barra caliente unidimensional en estado 
estacionario. Aunque este ejemplo no usa EDP, nos permite desarrollar y demostrar los principales 


Material A 


Material B 


Material C 


a) b) c) 


Figura 31.1 


a) Un empaque con geometría irregular y composición no homogénea. b) Un sistema así es muy difícil de modelar con la 
técnica por diferencias finitas. Esto se debe al hecho de que se necesitan aproximaciones complicadas en las fronteras del 
sistema y en las fronteras entre las regiones de diferente composición. c) Una discretización por elementos finitos es mucho 


más adecuada para tales sistemas. 
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aspectos de la técnica del elemento finito, evitando llegar a factores complicados. Después podemos 
analizar algunos problemas con el empleo del método del elemento finito para resolver EDP. 


31.1 EL ENFOQUE GENERAL 


Aunque las particularidades varían, la implementación del método del elemento finito usualmente 
sigue un procedimiento estándar paso a paso. A continuación se presenta un panorama general de 
cada uno de estos pasos. La aplicación de tales pasos a problemas de ingeniería se desarrollará en 
las siguientes secciones. 


31.1.1 Discretización 


Este paso consiste en dividir el dominio de la solución en elementos finitos. En la figura 31.2 se 
muestran ejemplos de los elementos empleados en una, dos y tres dimensiones. Los puntos de inter- 
sección de las líneas que forman los lados de los elementos se conocen como nodos, y los mismos 
lados se denominan líneas o planos nodales. 


31.1.2 Ecuaciones de los elementos 


El siguiente paso consiste en desarrollar ecuaciones para aproximar la solución de cada elemento y 
consta de dos pasos. Primero, se debe elegir una función apropiada con coeficientes desconocidos 
que aproximará la solución. Segundo, se evalúan los coeficientes de modo que la función aproxime 
la solución de manera óptima. 


Elección de las funciones de aproximación Debido a que son fáciles de manipular matemá- 
ticamente, a menudo se utilizan polinomios para este propósito. En el caso unidimensional, la alter- 
nativa más sencilla es un polinomio de primer grado o línea recta. 


u(x) = a, + a,x G1.1) 


donde u(x) = la variable dependiente, a, y a, =constantes y x= la variable independiente. Esta función 
debe pasar a través de los valores de w(x) en los puntos extremos del elemento en x, y x,. Por lo tanto, 
u =4,+4xX, 
u,=4,+0X, 
Elemento lineal 


A A donde u, = u(x,) y u, = u(x,). De estas ecuaciones, usando la regla 
a) Unidimensional de Cramer, se obtiene 
U,X, —U,X U, —u 
dy AAA aya A 
X= Xy XX 
Línea nodal Estos resultados se sustituyen en la ecuación (31.1) la cual, después 
de reagrupar términos, se escribe como 
Elemento Elemento 
cuadrilateral triangular u = Nu, + N,u, (31.2) 
b) Bidimensional donde 
X, =X 
N == (31.3) 
X= Xy 
Elemento y 
hexaédrico 
Plano nodal s 
Figura 31.2 
Ejemplos de los elementos empleados en a) una, b) dos y c) tres 
dimensiones. 


c) Tridimensional 
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XxX, 


N,= (31.4) 


X= X 


La ecuación (31.2) se conoce como una función de aproximación, O de forma, y N, y N, se 
denominan funciones de interpolación. Una inspección cuidadosa revela que la ecuación 
(31.2) es, en realidad, el polinomio de interpolación de primer grado de Lagrange. Esta 
ecuación ofrece un medio para predecir valores intermedios (es decir, para interpolar) entre 
valores dados u, y u, en los nodos. 

La figura 31.3 muestra la función de forma junto con las funciones de interpolación co- 
rrespondientes. Observe que la suma de las funciones de interpolación es igual a uno. 

Además, el hecho de que estemos tratando con ecuaciones lineales facilita las operacio- 
nes como la diferenciación y la integración. Tales manipulaciones serán importantes en 
secciones posteriores. La derivada de la ecuación (31.2) es 


du  dN, dN, 
= u + 
dx dx dx 


7A (B1.5) 


dN, — 1 dN, 1 616) 
dx X, —X, dx xXx, : 
y, por lo tanto, la derivada de u es 
du 1 
a (31.7) 
dx X,=X, 


En otras palabras, es una diferencia dividida que representa la pendiente de la línea recta que 
une los nodos. 


c) 
SA | 
*] * 
d) 


Figura 31.3 

b) Una aproximación lineal o 
función de forma para a) un 
elemento lineal. Las funciones 
de interpolación correspon- 
dientes se muestran en c) y d). 


La integral se expresa como 


Ñ udx = (Nu, + Nu, )dx 


Xx Xx 


Cada uno de los términos del lado derecho es simplemente la integral de un triángulo rectángulo con 
base x, — x, y altura u. Es decir, 


X2 1 
j Nu dx == (x, — x,)u 
x 2 


Así, la integral completa es 


xa + 
j ud= 2 (x, —x,) (31.8) 
Xx 


En otras palabras, esto es simplemente la regla del trapecio. 


Obtención de un ajuste óptimo de la función a la solución Una vez que se ha elegido la 
función de interpolación, se debe desarrollar la ecuación que rige el comportamiento del elemento. 
Esta ecuación representa un ajuste de la función a la solución de la ecuación diferencial de que se 
trate. Existen varios métodos para este propósito; entre los más comunes están el método directo, 
el método de los residuos ponderados y el método variacional. Los resultados de todos estos méto- 
dos son análogos al ajuste de curvas. Sin embargo, en lugar de ajustar funciones a datos, estos 
métodos especifican relaciones entre las incógnitas de la ecuación (31.2) que satisfacen de manera 
óptima la EDP. 
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Matemáticamente, las ecuaciones del elemento resultante a menudo consisten en un sistema de 
ecuaciones algebraicas lineales que puede expresarse en forma matricial, 


[k](u) = (F) (31.9) 


donde [k] = una propiedad del elemento o matriz de rigidez, [u) = vector columna de las incógnitas 
en los nodos y ([F'] = vector columna determinado por el efecto de cualquier influencia externa 
aplicada a los nodos. Observe que, en algunos casos, las ecuaciones pueden ser no lineales. Sin 
embargo, en los ejemplos elementales descritos aquí, así como en muchos problemas prácticos, los 
sistemas son lineales. 


31.1.3 Ensamble 


Una vez obtenidas las ecuaciones de elementos individuales, éstas deben unirse o ensamblarse para 
caracterizar el comportamiento de todo el sistema. El proceso de ensamble está regido por el concep- 
to de continuidad. Es decir, las soluciones de elementos contiguos se acoplan, de manera que los 
valores de las incógnitas (y algunas veces las derivadas) en sus nodos comunes sean equivalentes. 
Así, la solución total será continua. 

Cuando finalmente todas las versiones individuales de la ecuación (31.9) están ensambladas, el 
sistema completo se expresa en forma matricial como 


[Kl[u”) = (F) (31.10) 


donde [K] = la matriz de propiedades de ensamble y [u”) y [F”) = vectores columna de las incóg- 
nitas y de las fuerzas externas, marcadas con apóstrofos para denotar que son ensamble de los 
vectores fu) y (FF) de los elementos individuales. 


31.1.4 Condiciones de frontera 


Antes de resolver la ecuación (31.10) debe modificarse para considerar las condiciones de frontera 
del sistema. Dichos ajustes dan como resultado 


[kJ (u) = (F) G1.11) 


donde la barra significa que las condiciones de frontera se han incorporado. 


31.1.5 Solución 


Las soluciones de la ecuación (31.11) se obtienen con las técnicas que se describieron en la parte tres, 
tal como la descomposición LU. En muchos casos, los elementos pueden configurarse de manera 
que en las ecuaciones resultantes su matriz de coeficientes sea de banda. Así, es posible utilizar los 
esquemas de solución altamente eficientes para estos sistemas. 


31.1.6 Procesamiento posterior 


Una vez obtenida la solución, ésta se despliega en forma tabular o de manera gráfica. Además, pue- 
den determinarse las variables secundarias y también mostrarse. 

Aunque los pasos anteriores son muy generales, son comunes a la mayoría de las implementa- 
ciones del método del elemento finito. En la siguiente sección ilustraremos cómo se aplican para 
obtener resultados numéricos de un sistema físico simple (una barra caliente). 


31.2 APLICACIÓN DEL ELEMENTO FINITO EN UNA DIMENSIÓN 


En la figura 31.4 se muestra un sistema que puede modelarse mediante la forma unidimensional de 
la ecuación de Poisson 


da?T 
e =-f(x) (31.12) 
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Figura 31.4 
a) Barra larga y delgada sujeta a condiciones de frontera £0% 
fijas y una fuente de calor continua a lo largo de su eje. b) 
Representación del elemento finito que consta de cuatro | | 

: A A T(O, t) T(L, €) 
elementos de igual longitud y cinco nodos. | | 


0 Xx 


a) 


*x 


donde f(x) = una función que define una fuente de calor 
alo largo de la barra, y donde los extremos de la barra se 
mantienen a temperaturas fijas, 1 2 3 4 5 


T(0, 1) =7, O) O) O) O) 


b) 


T(L, 9) =T, 


Observe que ésta no es una ecuación diferencial parcial, sino una EDO con valor en la frontera. Se 
usa este modelo sencillo porque nos permitirá introducir el método del elemento finito sin algunas de las 
complicaciones de una EDP bidimensional, por ejemplo. 


EJEMPLO 31.1 Solución analítica para una barra caliente 
Planteamiento del problema Resuelva la ecuación (31.12) para una barra de 10 cm con las si- 
guientes condiciones de frontera, T(0, £) = 40 y T(0, £) = 200 y una fuente de calor uniforme de f(x) 


=10. 


Solución La ecuación a resolver es 


Suponga una solución de la forma 
T=ax+bx+c 


la cual se deriva dos veces para obtener T”= 2a. Sustituyendo este 
resultado en la ecuación diferencial da a=-5. Las condiciones de TA 
frontera se utilizan para evaluar los coeficientes restantes. Para la 
primera condición en x= 0, 


40 =-S(0? + b(0)+c 


o c=40. De manera similar, para la segunda condición, 


200 + 
200 =-5(10Y + b(10) + 40 


de donde se obtiene b = 66. Por lo tanto, la solución final es 


T=-53x? + 66x + 40 


Los resultados se grafican en la figura 31.5. o 


Figura 31.5 

Distribución de temperatura a lo largo de una placa caliente sujeta 
a Una fuente de calor uniforme y mantenida a temperaturas fijas 
en los extremos. 5 10 7 
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31.2.1 Discretización 


Una configuración sencilla para modelar el sistema consiste en una serie de elementos de igual lon- 
gitud (figura 31.4b). Así, el sistema se trata como cuatro elementos de igual longitud y cinco nodos. 


31.2.2 Ecuaciones de los elementos 


En la figura 31.6a se muestra un elemento individual. La distribución de temperatura para el elemen- 
to se representa por la función de aproximación 


T =NT,+N, (31.13) 


donde N, y N, = funciones de interpolación lineales especificadas por las ecuaciones (31.3) y (31.4), 
respectivamente. De esta manera, como se ilustra en la figura 31.6b, la función de aproximación 
corresponde a una interpolación lineal entre las dos temperaturas nodales. 

Como se presentó en la sección 31.1, existen diferentes métodos para desarrollar la ecuación del 
elemento. En esta sección empleamos dos de ellos. Primero, se usará un método directo para el caso 
sencillo donde f(x) = 0. Posteriormente, debido a su aplicabilidad general en ingeniería, dedicamos 
la mayor parte de la sección al método de los residuos ponderados. 


El método directo En el caso donde f(x) = 0, se utiliza un método directo para generar las ecua- 
ciones de los elementos. La relación entre el flujo de calor y el gradiente de temperatura puede re- 
presentarse mediante la ley de Fourier: 
dT 
== =p — 
. dx 
donde q = flujo [cal/(cm? - s)] y k” = coeficiente de conductividad térmica [cal/(s - cm - *C)]. Si se 
utiliza una función de aproximación lineal para caracterizar la temperatura del elemento, el flujo de 
calor hacia el elemento a través del nodo 1 se representa por 


Estas dos ecuaciones expresan la relación de la distribución de la temperatura interna de los elemen- 
tos (determinada por las temperaturas nodales) con el flujo de calor en sus extremos. En consecuencia 
representan nuestras ecuaciones deseadas de los elementos. Se simplifican aún más reconociendo 
que la ley de Fourier se puede utilizar para expresar los flujos de los extremos en términos de los 
gradientes de temperatura en las fronteras. Es decir, 

dT(x,) 


e da q)=K 


dT(x,) 
dx 


que se sustituyen en las ecuaciones de los elementos para dar 


1 


b) 


Mm dT(x,) 
1 Ll == El. dx 
Ta -=x|-1 1]|25f jar) (31.14) 
dx 
Figura 31.6 
xa a) Un elemento individual. b) Función de aproximación usada para caracterizar la distribución 


de temperatura a lo largo del elemento. 


31.2 Aplicación del elemento finito en una dimensión 


Observe que la ecuación (31.14) se presentó en el formato de la ecuación (31.9). Así, logramos 
generar una ecuación matricial que describe el comportamiento de un elemento típico de nuestro 
sistema. 

El método directo resulta muy intuitivo. Se utiliza en áreas como la mecánica, para resolver 
problemas importantes. Sin embargo, en otros contextos a menudo es difícil, si no es que imposible, 
obtener directamente las ecuaciones del elemento finito. En consecuencia, como se describe a con- 
tinuación, se cuenta con técnicas matemáticas más generales. 


El método de los residuos ponderados La ecuación diferencial (31.12) se reexpresa como 
ed 

dx? 
La solución aproximada [ecuación (31.13)] se sustituye en esta ecuación. Como la ecuación (31.13) 
no es la solución exacta, el lado izquierdo de la ecuación resultante no será cero, sino que será igual 


0 


+ f(x) 


697 


a un residuo, 


ar 
dx? 


R + f(x) 


(31.15) 


El método de los residuos ponderados (MRP) consiste en encontrar un mínimo para el residuo, 


de acuerdo con la fórmula general 


j RWdD=0  i=12,....m 
D 


(31.16) 


donde D = dominio de la solución y W, = funciones de ponderación linealmente independientes. 
Aquí, se tienen múltiples opciones para las funciones de ponderación (cuadro 31.1). El procedi- 

miento más común para el método del elemento finito consiste en emplear las funciones de interpo- 

lación N, como las funciones de ponderación. Cuando éstas se sustituyen en la ecuación (31.16), el 


resultado se conoce como el método de Galerkin, 


Cuadro 31.1 Esquemas de residuos alternativos para el MRP 


Se puede elegir entre varias funciones de ponderación para la ecuación 
(31.16). Cada una representa un procedimiento alternativo para el MRP. 

Enel método de lacolocación, elegimostantas posicionescomo co- 
eficientes desconocidos existan. Después, se ajustan los coeficientes 
hasta que los residuos desaparezcan en cada una de estas posiciones. 
Por lo tanto, la función de aproximación dará resultados perfectos en 
las posiciones elegidas, pero en las posiciones restantes tendremos un 
residuo diferente de cero. Así, este método es parecido a los de inter- 
polación del capítulo 18. Observe que la colocación corresponde ausar 
la función de ponderación 

W=0 (x- x) 
donde n = el número de coeficientes desconocidos y Ó (x- x,) = la 
función delta de Dirac, que es igual a cero en todas partes excepto 
en x= x, donde es igual a 1. 

En el método del subdominio, el intervalo se divide en tantos 
segmentos, o “subdominios”, como coeficientes desconocidos exis- 
tan. Después, se ajustan los coeficientes hasta que el valor promedio 
del residuo sea cero en cada subdominio. Así, en cada subdominio, 
la función de ponderación será igual a 1, y la ecuación (31.16) se 
convierte en 


parai=1,2,...,n 


“ Rdx=0 parai=1,2, ,n 


X, 


Xi 


donde x,_, y x, son las fronteras del subdominio. 


En el caso de mínimos cuadrados, los coeficientes se ajustan 
hasta minimizar la integral del cuadrado del residuo. De manera que 
las funciones de ponderación son 


w=2 
04, 


al sustituir las W, en la ecuación (31.16), se obtiene 


| an=o ¡=1,2,...,n 
D da, 


21 R%dD=0 ¡=1,2,....n 
da, Jo 


La comparación de esta formulación con la del capítulo 17 muestra 
que ésta es la forma continua de la regresión. 

El método de Galerkin emplea las funciones de interpolación N, 
como funciones de ponderación. Recuerde que estas funciones siem- 
pre suman 1 en cualquier posición en un elemento. En muchos pro- 
blemas, el método de Galerkin da los mismos resultados que los que 
se obtienen con los métodos variacionales. En consecuencia, ésta es 
la versión del MRP que se emplea con más frecuencia en el análisis 
del elemento finito. 
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j RN,dD=0 — i=1,2,....m 
D 


En nuestra barra unidimensional, la ecuación (31.15) se sustituye en esta formulación para dar 


E E+30) de ika 


que se pueden reexpresar como sigue: 


Eno as 1000 as ¡=1,2 


y dx? (31.17) 


Ahora, se aplicarán varias manipulaciones matemáticas para simplificar y evaluar la ecuación 
(31.17). Una de las más importantes es la simplificación del lado izquierdo usando la integración por 
partes. Del cálculo, recuerde que esta operación se expresa como 


b b b 
j udo=wl, | v du 
a a 


St u y vu se eligen adecuadamente, la nueva integral en el lado derecho será más fácil de evaluar que 
la integral original del lado izquierdo. Esto se puede hacer para el término del lado izquierdo de la 
ecuación (31.17), escogiendo N.(x) como u, y (d?T/dx?) dx como dv, se obtiene 


f dT dN, 


f NoE NOA lA dx dx 


dx  i=1,2 (31.18) 


Así, hemos dado el importante paso de bajar el orden superior en la formulación: de una segunda a 
una primera derivada. 

A continuación, se evalúa cada uno de los términos que hemos creado en la ecuación (31.18). 
Para ¡= 1, el primer término del lado derecho de la ecuación (31.18) se evalúa como sigue 


dí" 


E 0) e ) 
dx 


=N,(x,) N(x,) 


Xx 


Sin embargo, de la figura 31.3 recuerde que N,(x,) =0 y N,(x,) = 1 y, por lo tanto, 


mo E MT) (31.19) 
dx 
XxX 
De manera similar, para ¡=2, 
N,(x jar Ez) (31.20) 
dx 


Xx 


Así, el primer término en el lado derecho de la ecuación (31.18) representa las condiciones de fron- 
tera naturales en los extremos de los elementos. 

Ahora, antes de continuar, reagrupemos sustituyendo en la ecuación original los términos co- 
rrespondientes por nuestros resultados. Empleamos las ecuaciones (31.18) a (31.20) para hacer las 
sustituciones correspondientes en la ecuación (31.17); para ¡= 1, 


dx 
Xx dx dx 


E a To, + 10m ds (31.21) 


y para ¡=2, 


31.2 Aplicación del elemento finito en una dimensión 


1 dT dN, E dT(x,) +|"109N,0 de (31.22) 
Xx dx dx dx x 


Observe que la integración por partes nos llevó a dos importantes resultados. Primero, ha in- 
corporado las condiciones de frontera directamente dentro de las ecuaciones del elemento. Segundo, 
ha bajado la evaluación de orden superior, de una segunda a una primera derivada. Este último re- 
sultado tiene como consecuencia significativa que las funciones de aproximación necesitan preservar 
continuidad de valor, pero no pendiente en los nodos. 

Observe también que ahora podemos comenzar a darles significado físico a cada uno de los 
términos que obtuvimos. En el lado derecho de cada ecuación, el primer término representa una 
de las condiciones de frontera del elemento; y el segundo es el efecto de la función de fuerza del 
sistema, en este caso, la fuente de calor f(x). Como ahora será evidente, el lado izquierdo repre- 
senta los mecanismos internos que rigen la distribución de la temperatura del elemento. Es decir, 
en términos del método del elemento finito, el lado izquierdo será la matriz de propiedad del 
elemento. 

Para ver esto nos concentramos en los términos del lado izquierdo. Para ¡ = 1, el término es 


— ——dx (31.23) 


Recordemos de la sección 31.1.2 que la naturaleza lineal de la función hace que la diferenciación y 
la integración sean sencillas. Si empleamos las ecuaciones (31.6) y (31.7) para hacer las sustituciones 
correspondientes en la ecuación (31.23), obtenemos 


16 A — mt (31.24) 


2 
1 (x, —X,) XX] 


De manera similar para ¡ = 2 [ecuación (31.22)], 


p222- l CT, +T) (31.25) 
x1 (x, —Xx,) XX; 


Una comparación con la ecuación (31.14) nos muestra que éstas son similares a las relaciones 


obtenidas con el método directo usando la ley de Fourier, lo cual se aclara más al expresar las ecua- 
ciones (31.24) y (31.25) en forma matricial como sigue: 


1 tr —1]% 
x=x|1 1]|5 
Si este resultado se sustituye en las ecuaciones (31.21) y (31.22), y después se expresa en forma 
matricial, obtenemos la versión final de las ecuaciones de los elementos. 


; , 4 E dT(x,) Proon, MS E 
a E 1 lim- Pa de (31.26) 
— ASES 


Matriz de rigidez 
del elemento Condición Efectos externos 
de frontera 


Observe que las ecuaciones del elemento pueden obtenerse no sólo mediante los métodos direc- 
to y de los residuos ponderados, sino también usando el cálculo de variaciones (por ejemplo, véase 
Allaire, 1985). En el caso presente, este método proporciona ecuaciones idénticas a las deducidas 
arriba. 
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Tabla 31.1 Topología del sistema para el 


Capítulo 31 Método del elemento finito 


EJEMPLO 31.2 Ecuación del elemento en una barra caliente 


Planteamiento del problema Emplee la ecuación (31.26) para desarrollar las ecuaciones del 
elemento dada una barra de 10 cm, con condiciones de frontera de T(0, £) = 40 y T(0, £) =200 y una 
fuente de calor uniforme con f(x) = 10. Utilice cuatro elementos del mismo tamaño con longitud = 
2.5 cm. 


Solución El término de la fuente de calor en el primer renglón de la ecuación (31.26) se evalúa 
sustituyendo la ecuación (31.3), e integrando para obtener 


25 25—x 


10 dx=12.5 
0 


De manera similar, la ecuación (31.4) se sustituye en el término de la fuente de calor del segundo 
renglón de la ecuación (31.26), el cual también se integra para obtener 


dx=12.5 


2.5 x-0 


10 
0 2.5 


Estos resultados, junto con los valores de los otros parámetros, se emplean para sustituirse en la 
ecuación (31.26) y así obtener 


0.47, -0.4T, = an (x,)+12.5 
dx 


var +04, = LE (x,)+12.5 
dx 


esquema de 


del elemento finito de la 


figura 31.4b 


31.2.3 Ensamble 


Antes de que se ensamblen las ecuaciones del elemento, se debe establecer un esquema de numera- 
ción global que especifique la topología o el arreglo espacial del sistema. Como en la tabla 31.1, esto 
define la conectividad de los elementos en la malla. Debido a que este caso es unidimensional, el 
esquema de numeración parecerá tan predecible que resulta trivial. Sin em- 
bargo, en problemas para dos y tres dimensiones, tal esquema es el único 
medio para especificar qué nodos pertenecen a qué elementos. 

Una vez que se ha especificado la topología, la ecuación del elemento 
(31.26) se puede escribir para otros elementos usando las coordenadas del 
sistema. Después, éstas se agregan (una por una) para ensamblar la matriz de 


segmentación 


Número de nodos 


todo el sistema (este proceso se continuará explorando en la sección 32.4). El 
proceso se ilustra en la figura 31.7. 


Elemento Local Global 

h ! , 31.2.4 Condiciones de la frontera 

2 1 2 Observe que conforme se ensamblan las ecuaciones, se cancelan las condicio- 
2 3 nes de frontera internas. Así, el resultado final de (F) en la figura 31.7€e tiene 

3 1 3 e A Ñ 8 O 
A a condiciones de frontera sólo para el primero y el último nodos. Ya que T, y T, 

4 1 4 están dados, dichas condiciones de frontera naturales en los extremos de la 
2 5 barra, dT(x,)/dx y dT(x,)/dx, representan incógnitas. Por lo tanto, las ecuacio- 


==  NM€S Se regxpresan como sigue: 


Figura 31.7 


31.2 Aplicación del elemento finito en una dimensión 


Ensamble de las ecuaciones de todo el sistema. 


A 0.4T, 
dx 

0.8T, 

0.47, 


31.2.5 Solución 


De la ecuación (31.27) se obtiene 


dT 
011) =06 


T, =253.75 


) =173.75 


dT 
— =-34 
dx (45) 


31.2.6 Proceso posterior 


Los resultados se representan gráficamente. En la figura 31.8 se muestran los resultados del método 
del elemento finito, junto con la solución exacta. Observe que el cálculo del elemento finito capta la 


0.47, 

+0.8T, -0.4T, 

-0.4T, +0.8T, 
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=dT(x,) /dx +12.5 
dTlx,) /dx+12.5 
0 
0 
0 


EVE 
125+12.5 
aT(x,) /dx+12.5 
0 
0 


=dT(x,) /dx +12.5 
25 
125+12.5 
aT(x,)/dx+12.5 
0 


=dTlx,) /dx+12.5 
25 
£eS] 
125+12.5 
dTlx.1/d+12,5 


=dT[x,) /dx +12.5 
25 
25 
25 
dTlx.)/dx+12.5 


(31.27) 
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4 a Figura 31.8 
dtonds Resultados al aplicar el método del elemento finito a una barra 
dl caliente. También se muestra la solución exacta. 


Elemento finito 


200 tendencia general de la solución exacta y, además, da una coinci- 


dencia exacta en los nodos. Sin embargo, existe una discrepancia 
en el interior de cada elemento debido a la naturaleza lineal de las 
funciones de forma. 


nel 31.3 PROBLEMAS BIDIMENSIONALES 


Aunque la “contabilidad” matemática aumenta de forma notable, 
la extensión del método del elemento finito a dos dimensiones es 
similar, conceptualmente, a los problemas unidimensionales 
5 10 z analizados hasta ahora. De manera que se siguen los mismos 
pasos señalados en la sección 31.1. 


31.3.1 Discretización 


Comúnmente se emplean elementos sencillos, como triángulos o cuadriláteros, en la malla del ele- 
mento finito para dos dimensiones. En este análisis, nos limitaremos a elementos triangulares del 
tipo ilustrado en la figura 31.9. 


31.3.2 Ecuaciones del elemento 


Tal como en el caso unidimensional, el siguiente paso consiste en desarrollar una ecuación para 
aproximar la solución del elemento. Para un elemento triangular, la aproximación más sencilla es el 
polinomio lineal [compare con la ecuación (31.1)] 


u(x, y) =4,+4, x+4, y (31.28) 


donde u(x, y) = la variable dependiente, las a = coeficientes, x y y = variables independientes. Esta 
función debe pasar a través de los valores de u(x, y) en los nodos del triángulo (x,, y), (X,, Y,) y 
(x,, y,). Por lo tanto, 


u (x, y) = a4,+4,X, +4), 
ux, y)= a, +4, Xx, +4, Y, 
u(x, y)= 4, +4, X, +0, Y, 


o, en forma matricial, 


1 Xy Y a) u; 
YA 1 Xx Y A p=3U4) 
1 * Y 41 uz 
2 de donde se obtiene 
, 1 
a, = AA — X3Y2) FU (Xy, — X Y3) +43 (Xx), — Xy )] (31.29) 
1 e 
A 1 
=> AO FO IR (31.30) 
Figura 31.9 i 
eii aya = 7 lu xy 1) +46 00 1) +40) G13I) 


2A 


e 


donde A, es el área del elemento triangular, 


1 
A, = ¿LY — M3) 4 (2%, Y, 2,93) +(2,), = X2J)] 


Las ecuaciones (31.29) a (31.31) se sustituyen en la ecuación (31.28). Después de reagrupar 


términos semejantes, el resultado se expresa como sigue: 
u=Nu, + Nu, + N,u, 


donde 


1 
N, = a ad —X3Y2) + (Y, — Y) + (5 — 1, )p] 


€, 


N, 


27 a AY —X1Y3)+ (3 — Y) +(x, — X3)y] 


1 
N, = ADE — XI) HO) — YH, — 1) y 1 


e 


La ecuación (31.32) permite predecir valores intermedios en el elemento, con base en los valores 
de sus nodos. En la figura 31.10 se muestra la función de forma junto con las funciones de interpola- 


ción correspondientes. Observe que la suma de las funciones de 
interpolación es siempre igual a 1. 

Como en el caso unidimensional, hay varios métodos para 
desarrollar las ecuaciones del elemento, basados en la EDP y en las 
funciones de aproximación. Las ecuaciones resultantes son con- 
siderablemente más complicadas que la ecuación (31.26). Sin 
embargo, como las funciones de aproximación son normalmente 
polinomios de grado inferior como la ecuación (31.28), los térmi- 
nos de la matriz final del elemento consistirán de polinomios de 
grado inferior y de constantes. 


31.3.3 Condiciones de la frontera y ensamble 


La incorporación de condiciones de la frontera y el ensamble de 
la matriz del sistema también se hacen un poco más complicados 
cuando la técnica del elemento finito se aplique a problemas en 
dos y tres dimensiones. Sin embargo, como en la deducción de 
la matriz del elemento, la dificultad está más relacionada con la 
mecánica del proceso que con la complejidad conceptual. Por 
ejemplo, el establecimiento de la topología del sistema, que fue 
trivial para el caso unidimensional, se convierte en un asunto de 
gran importancia en los casos de dos y tres dimensiones. En par- 
ticular, la elección de un esquema de numeración determinará el 
bandeado de la matriz del sistema resultante y, por lo tanto, la 
eficiencia con la que puede resolverse. En la figura 31.11 se mues- 
tra el esquema desarrollado antes para una placa caliente, y que 
se resolvió con los métodos por diferencias finitas en el capítulo 
29. 


Figura 31.10 
a) Una función de aproximación lineal para un elemento triangular. 
Las funciones de interpolación correspondientes se muestran en los 
incisos b) a d). 
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Figura 31.11 
El esquema de numeración de los nodos y los elementos de una aproximación 


por elemento finito de la placa caliente, que se caracterizó previamente por 
diferencias finitas en el capítulo 29. 


Figura 31.12 
Distribución de temperatura en una placa caliente, calculada 
con el método del elemento finito. 


31.3.4 Solución y procesamiento posterior 


Aunque los mecanismos de solución son complicados, la matriz del sistema es tan sólo un conjunto 
de n ecuaciones simultáneas que pueden usarse para encontrar los valores de la variable dependien- 
te en los n nodos. En la figura 31.12 se muestra una solución que corresponde a la solución por dife- 
rencias finitas de la figura 29.5. 


31.4 RESOLUCIÓN DE EDP CON PAQUETES DE SOFTWARE 


Los paquetes de software pueden ayudarnos a resolver directamente las EDP. Sin embargo, como se 
describe en las siguientes secciones, muchas de las soluciones están limitadas a problemas sencillos, 
lo cual es particularmente cierto para los casos de dos y de tres dimensiones. En tales situaciones, 
los paquetes genéricos (es decir, los no desarrollados expresamente para resolver EDP, como los 
paquetes para el elemento finito) a menudo están limitados a simples dominios rectangulares. 

Aunque esto podría parecer una limitante, los problemas sencillos llegan a tener gran utilidad 
desde el punto de vista pedagógico. Ocurre así cuando las herramientas de visualización de los pa- 
quetes se utilizan para desplegar los resultados de los cálculos. 


31.4.1 Excel 


Aunque Excel no tiene la posibilidad de resolver directamente EDP, es un buen ambiente para desa- 
rrollar soluciones sencillas para las EDP elípticas. Por ejemplo, la presentación ortogonal de las 
celdas de la hoja de cálculo (figura 31.13b) es análoga a la malla utilizada en el capítulo 29 para 
modelar la placa caliente (figura 31.13a). 

Como en la figura 31.13b, las condiciones de frontera de Dirichlet pueden introducirse primero 
en el contorno del bloque de la celda. La fórmula del método de Liebmann se implementa al intro- 
ducir la ecuación (29.12) en una de las celdas del interior (como la celda B2 de la figura 31.135). Así, 
el valor de la celda se calcula en función de las celdas adyacentes. Luego se copia la celda a las otras 
celdas interiores. Debido a la naturaleza relativa de la instrucción copiar de Excel, todas las demás 
celdas serán dependientes de sus celdas adyacentes. 


31.4 Resolución de EDP con paquetes de software 705 
Figura 31.13 
Analogía entre a) una malla rectangular y b) las pS no 100 
celdas de una hoja de cálculo. A B C D E 
1 |875| 100 | 100 | 100 | 75 
75 2 75 |78.57|76.12|69.64| 50 
z z 3 75 [63.17|56.25|52.46| 50 
Una vez que usted ha copiado la fórmula, 4175 /4286/33.26133.93| 50 
probablemente obtendrá un mensaje de error: 5137 0 0 0 25 
Cannot resolve circular references (No se pueden 5 
resolver referencias circulares). Usted puede recti- 100 1 Pm e0S " BL+C2+B3+42 
ficar esto al seleccionar File (Archivo), Options 13 4 B2 4 
(Opciones) y haciendo clic en la categoría Formu- a) Malla A desieno 


las (Fórmulas). Luego seleccione Calculation 

options (Opciones de cálculo) y verifique el cua- 

dro Iterative calculation (Cálculo iterativo). Esto 

permite que la hoja de cálculo vuelva a calcular (por omisión, son 100 iteraciones) y seguir el método 

de Liebmann iterativamente. Después de esto, presione la tecla F9 para volver a calcular de forma 

manual la hoja hasta que las respuestas no varíen, lo cual significa que ha convergido la solución. 
Una vez resuelto el problema, se utilizan las herramientas gráficas de Excel para visualizar los 

resultados. En la figura 31.14a se muestra un ejemplo. En tal caso, se tiene que 


+ Se usó una malla fina 
+ Se aisló la frontera inferior 
+ Se agregó una fuente de calor de 150 a la mitad de la placa (celda E5). 


1 87.5|100.0|100.0| 100.0|100.0| 100.0|100.0|100.0| 75.0 
2 75.0| 89.2| 95.8| 99.1| 99.7| 96.6| 89.9| 77.6| 50.0 
3 75.0| 86.2| 94.7|100.9|103.1| 96.7| 85.5| 70.3| 50.0 
4 75.0| 85.7| 96.1|106.7|115.3|101.4| 85.2| 68.2| 50.0 
5 75.0| 85.5| 97.4|114.3|150.0| 108.6| 85.6| 67.3| 50.0 
6 75.0| 84.0| 93.4| 103.4|111.6| 97.4| 81.3| 65.6| 50.0 
7 75.0| 82.2| 88.9| 94.2| 95.6| 88.1| 76.6| 63.6| 50.0 
8 75.0| 80.9| 85.9| 88.9| 88.4| 82.8| 73.5| 62.2| 50.0 
9 75.0| 80.4| 84.9| 87.3| 86.3| 81.1| 72.4| 61.7| 50.0 
a) 

160 

140 

120 

100 

80 

60 

40 

b) c) 


Figura 31.14 
a) Solución en Excel de la ecuación de Poisson para una placa con un extremo inferior aislado y una 
fuente de calor. b) “Mapa topográfico” y c) ilustración tridimensional de las temperaturas. 
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Los resultados numéricos de la figura 31.14a pueden ilustrarse con el asistente para gráficos de 
Excel. Las figuras 31.14b y c muestran gráficas de superficies tridimensionales. Por lo general, la 
orientación y de éstas es la inversa de la hoja de cálculo. Así, el extremo superior de las temperaturas 
más altas (100) normalmente se representará en la parte inferior de la gráfica. Hemos invertido los 
valores de y en nuestra hoja antes de graficar, de modo que las gráficas sean consistentes con la hoja 
de cálculo. 

Advierta cómo las gráficas nos ayudan a visualizar lo que sucederá. El calor fluye hacia abajo 
desde la fuente hasta las fronteras, formando una imagen parecida a una montaña. El calor también 
fluye hacia abajo desde la frontera con temperatura alta hasta los dos extremos laterales. Observe 
cómo el calor fluye hacia el extremo de baja temperatura (50). Por último, observe cómo el gradien- 
te de temperatura en la dimensión y tiende a cero para el extremo inferior aislado (97/dy > 0). 


31.4.2 MATLAB 


Aunque el paquete MATLAB estándar no tiene grandes capacidades para resolver las EDP, se pue- 
den desarrollar archivos M y funciones con este propósito. Además, su capacidad para mostrar 
imágenes es muy útil, en particular para visualizar problemas bidimensionales. 

Para ilustrar esta capacidad, primero desarrollamos la hoja de cálculo en Excel de la figura 
31.14a. Estos resultados pueden guardarse como un archivo de texto, con un nombre como plate.txt. 
Después este archivo se traslada al directorio de MATLAB. 

Una vez en MATLAB, se carga este archivo escribiendo 


>> load plate.txt 
Luego, los gradientes se calculan simplemente así 


>> [px,pyl=gradient (plate); 


Observe que éste es el método más simple para calcular gradientes usando los valores por omisión 
de dx = dy = 1. Por lo tanto, serán correctas las direcciones y las magnitudes relativas. 

Por último, se utilizan una serie de comandos para obtener la gráfica. El comando contour de- 
sarrolla una gráfica de contorno de los datos. El comando clabel agrega etiquetas de contorno a la 
gráfica. Finalmente, quiver toma los datos del gradiente y los añade a la gráfica en forma de flechas. 


>> cs=contour (plate) ;clabel (cs) ;hold on 


>> quiver (-px,-py);hold off 


Observe que se ha agregado el signo menos, debido al signo menos de la ley de Fourier [ecuación 
(29.4)]. Como se ve en la figura 31.15, la gráfica resultante proporciona una excelente representación 
de la solución. 

Observe que cualquier archivo en el formato adecuado se puede introducir en MATLAB y se 
puede mostrar de esta manera. Esta posibilidad de compartir archivos entre las herramientas se está 
volviendo usual. Además, se pueden crear archivos en una ubicación en una herramienta, transmi- 
tirlos por internet a otra ubicación donde el archivo se puede abrir con otra herramienta. Éste es uno 
de los aspectos atractivos de las aplicaciones numéricas modernas. 


31.4.3 Mathcad 


Mathcad tiene dos funciones que pueden resolver la ecuación de Poisson. Usted puede usar la fun- 
ción relax cuando sepa el valor de la incógnita en los cuatro lados de una región cuadrada. Esta 
función resuelve un sistema de ecuaciones algebraicas lineales usando la iteración de Gauss-Seidel 
con sobrerrelajamiento para acelerar la rapidez de convergencia. Para el caso especial en el que hay 
fuentes internas o receptores internos y la incógnita es cero en todos los cuatro lados del cuadrado, 
entonces usted puede usar la función multigrid, que es usualmente más rápida que la función relax. 
Ambas funciones devuelven una matriz cuadrada donde la ubicación del elemento corresponde a 
su ubicación dentro de la región cuadrada. El valor del elemento se aproxima al valor de la solución 
de la ecuación de Poisson en este punto. 
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Figura 31.15 
Gráficas de contorno generadas en MATLAB y calculadas con Excel, para la placa caliente (figura 
31.14). 


'"Y' Mathcad 
dd] File Edit View Insert Format Tools Symbolics Window Help 


SOLVING PDES: 
R := 32 
Mar = 0 Ma 4 


S:= multigrid(M, 2) 


Figura 31.16 
Pantalla de Mathcad para determinar la solución de una EDP elíptica. 
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La figura 31.16 muestra un ejemplo en el que una placa cuadrada contiene fuentes de calor 
mientras la frontera se mantiene en cero. El primer paso es establecer dimensiones para la malla de 
temperatura y la matriz de la fuente de calor. La cuadrícula de temperatura tiene dimensiones (R + 1) 
x (R + 1), mientras que la matriz de la fuente de calor es R x R. Por ejemplo, una cuadrícula de 
temperatura de 3 x 3 tiene 4 (2 x 2) fuentes de calor posibles. En este caso, se establece una cuadrícu- 
la de temperatura de 33 x 33 y una matriz de fuente de calor de 32 x 32. El comando Mathcad M,,:= 0 
(con R = 32) establece las dimensiones de la matriz de fuentes y pone en cero todos los elementos. 
En seguida se establecen la ubicación y la fuerza de dos fuentes de calor. Finalmente, S es la distri- 
bución resultante de temperatura calculada con la función multigrid. El segundo argumento de 
multigrid es un parámetro que controla la exactitud numérica. Como lo sugiere la asistencia de Math- 
cad, un valor de 2 generalmente da una buena aproximación de la solución. 

La distribución de temperatura se puede mostrar con gráficas de superficie, contorno o campo 
vectorial. Éstas se pueden colocar en cualquier sitio en la hoja de trabajo haciendo clic en la ubicación 
deseada. Esto dispone una retícula roja en la ubicación. Luego use el menú desplegables Insert/Graph 
para colocar una gráfica vacía en la hoja de cálculo con espacios para las expresiones que se van a 
graficar y para los rangos de las variables. Simplemente teclee S en el espacio sobre el eje z. Mathcad 
hace el resto para producir las gráficas que se muestran en la figura 31.16. Una vez que se ha creado 
la gráfica, usted puede usar los menús desplegables Format/Surface Plot y Format/Contour Plot para 


cambiar el color o añadir títulos, rótulos y otras características. 


PROBLEMAS 


31.1 Repita el ejemplo 31.1, pero para T(0, t) =75 y T(10, £) = 150, 
y una fuente uniforme de calor de 15. 
31.2 Repita el ejemplo 31.2, pero para condiciones de frontera de 
T(0, £) =75 y T(L0, £) = 150, y una fuente de calor de 15. 
31.3 Aplique los resultados del problema 31.2 para calcular la dis- 
tribución de temperatura para la barra completa, con el uso del enfo- 
que del elemento finito. 
31.4 Utilice el método de Galerkin para desarrollar una ecuación 
de elemento para una versión de estado estable de la ecuación de 
advección-difusión descrita en el problema 30.7. Exprese el re- 
sultado final en el formato de la ecuación (31.26) de modo que 
cada término tenga una interpretación física. 
31.5 El modelo siguiente es una versión de la ecuación de Poisson 
que ocurre en la mecánica para la deflexión vertical de una barra con 
una carga distribuida P(x): 
y 

A,E =P(x) 
donde A, = área de la sección transversal, E = módulo de Young, u = 
deflexión y x = distancia medida a lo largo de la longitud de la barra. 
Si la barra está fija rígidamente (u = 0) por ambos extremos, use el 
método del elemento finito para modelar sus deflexiones para A, = 
0.1 m? E=200 x 10? N/m?, L= 10 m y PG) = 1 000 N/m. Emplee 
un valor de Ax=2 m. 
31.6 Desarrolle un programa amigable para el usuario a fin de mo- 
delar la distribución de estado estable de la temperatura en una barra 
con fuente de calor constante, con el método del elemento finito. 
Elabore el programa de modo que se utilicen nodos irregularmente 
espaciados. 
31.7 Utilice Excel para realizar el mismo cálculo que en la figura 
31.14, pero aísle el borde del lado derecho y agregue una fuente de 
calor de -150 en la celda C7. 
31.8 Emplee MATLAB o Mathcad para desarrollar una gráfica de 
contorno con flechas de flujo para la solución en Excel del problema 
31.7. 


31.9 Use Excel para modelar la distribución de temperatura de la 
placa que se muestra en la figura P31.9. La placa tiene 0.02 m de 
espesor y una conductividad térmica de 3 W/(m - *C). 


100%C 
+ >| 
100 W/m? 
75C | 1m 0.4 m 25C 
-— 0.6 m — 
50C 
Figura P31.9 


31.10 Use MATLAB o Mathcad para desarrollar una gráfica de 
contorno con flechas de flujo para la solución con Excel del proble- 
ma 31.9. 

31.11 Encuentre la distribución de temperatura en una barra (véase 
la figura P31.11) con generación de calor interno, por medio del 
método del elemento finito. Obtenga las ecuaciones nodales de ele- 


mento con el uso de la conducción de calor de Fourier. 
dT 
=-kA— 
Un aa 


y las relaciones de conservación del calor 


SY [g,+f(0]=0 


donde q, = flujo de calor (W), k= conductividad térmica (W/(m - *C)), 
A = área de la sección transversal (m?) y fx) = fuente de calor (W/ 


cm). La barra tiene un valor de kA = 100 W m/*C. La barra mide 50 
cm de largo, en el extremo izquierdo la coordenada x es cero y posi- 
tiva hacia la derecha. Divida la barra en 5 elementos (6 nodos, cada 
elemento de 10 cm de largo). El extremo izquierdo de la barra tiene 
un gradiente fijo de temperatura y la temperatura es variable. El extre- 
mo derecho tiene una temperatura fija y el gradiente es variable. La 
fuente de calor f(x) tiene un valor constante. Así, las condiciones son 


HI 025% T|,. =100%C  f(x)=30 Wíem 


x=0 
Desarrolle las ecuaciones nodales que deben resolverse para las 
temperaturas y los gradientes de temperatura en cada uno de los seis 
nodos. Acople las ecuaciones, inserte las condiciones de frontera y 
resuelva el conjunto resultante para las incógnitas. 


kA = 100 W/m - *C 


AT] -0.25'C/m ye Pb) = 30 W/cm 

dxl.-0 5 E 
“50 cm _—— 
añ T|. 50 = 100%C 


Figura P31.11 


31.12 Encuentre la distribución de temperatura en una barra (véase 
la figura P31.12) con generación interna de calor, con el método del 
elemento finito. Obtenga las ecuaciones de elementos nodales con el 
uso de la conducción de calor de Fourier. 


y las relaciones de conservación de calor 


Y lg, +f001=0 


Problemas 709 


donde q, = flujo de calor (W), k= conductividad térmica (W/(m - *C),, 
A = área de la sección transversal (m?) y fx) = fuente de calor (W/ 
cm). La barra mide 50 cm de longitud, la coordenada x es cero en el 
extremo izquierdo y positiva hacia la derecha. La barra también 
tiene bloqueos lineales en x= 0 y en x= 50, con un valor de kA = 100 
y S0W m/*C, respectivamente. Divida la barra en 5 elementos (6 nodos, 
cada elemento de 10 cm de largo). Ambos extremos de la barra tienen 
temperaturas fijas. La fuente de calor f(x) tiene un valor constante. 
Así, las condiciones son 


T|,_¿=100%C T|,_.,=50%C  f(x)=30 Wiem 


Las áreas bloqueadas deben tratarse como si fueran constantes en la 
longitud de un elemento. Por lo tanto, promedie los valores kA en 
cada extremo del nodo y tome el promedio como una constante en el 
nodo. Desarrolle las ecuaciones de elementos nodales que deben re- 
solverse para las temperaturas y los gradientes de temperatura en cada 
uno de los seis nodos. Ensamble las ecuaciones, inserte las condicio- 
nes de frontera y resuelva para el conjunto resultante de incógnitas. 


kA = 100 W - m/*C 
f(x) = 30 W/cm 


kA =50 W - m/*C 


Figura P31.12 


31.13 Use un paquete de software para resolver la distribución de 
temperatura de la placa en forma de L de la figura P29.18. Muestre 
sus resultados como gráfica de contorno con flechas de flujo. 


Estudio de casos: ecuaciones 
diferenciales parciales 


El propósito de este capítulo es aplicar los métodos de la parte ocho a problemas prácticos de inge- 
niería. En la sección 32.1 se utiliza una EDP parabólica para calcular la distribución de una sustancia 
química, dependiente del tiempo a lo largo del eje longitudinal de un reactor rectangular. Este ejem- 
plo ilustra cómo la inestabilidad de una solución puede deberse a la naturaleza de la EDP, más que a 
las propiedades del método numérico. 

Las secciones 32.2 y 32.3 presentan aplicaciones de las ecuaciones de Poisson y Laplace a pro- 
blemas de ingeniería civil y eléctrica. Entre otras cuestiones, esto le permitirá distinguir tanto las 
similitudes como las diferencias entre los problemas en esas áreas de la ingeniería. Además, se 
pueden comparar con el problema de la placa caliente que ha servido como sistema prototipo en esta 
parte del libro. La sección 32.2 trata de la deflexión de una placa cuadrada; mientras que la sección 
32.3 se dedica al cálculo de la distribución del voltaje y el flujo de carga en una superficie bidimen- 
sional con un extremo curvado. 

La sección 32.4 presenta un análisis del elemento finito aplicado a una serie de resortes. Este 
problema de mecánica y estructuras ilustra mejor las aplicaciones del elemento finito, que al proble- 
ma de temperatura usado para analizar el método en el capítulo 31. 


32.1 BALANCE DE MASA UNIDIMENSIONAL DE UN REACTOR 
(INGENIERÍA QUÍMICA/BIOINGENIERÍA) 


Antecedentes Los ingenieros químicos utilizan mucho los reactores idealizados en su trabajo 
de diseño. En las secciones 12.1 y 28.1 nos concentramos en reactores simples o acoplados bien 
mezclados, los cuales constituyen ejemplos de sistemas de parámetros localizados (recuerde la 
sección PT3.1.2). 

La figura 32.1 muestra un reactor alargado con una sola entrada y una salida. Este reactor puede 
caracterizarse como un sistema de parámetros distribuidos. Si se supone que la sustancia química que 
va a modelarse está sujeta a un decaimiento! de primer orden, y el tanque está bien mezclado vertical 
y lateralmente, se realiza un balance de masa en un segmento finito de longitud Ax, como sigue 


"Es decir, la sustancia química decae a una velocidad que es linealmente proporcional a la cantidad de sustancia química presente. 


Figura 32.1 

Reactor alargado con un solo punto de entrada y salida. Un balance de masa se desarrolla alrededor de 
un segmento finito a lo largo del eje longitudinal del tanque con el objetivo de deducir una ecuación 
diferencial para la concentración. 


32.1 Balance de masa unidimensional de un reactor (ingeniería química/bioingeniería) 


A, q DA. ge 
At A Ox Ox 
Flujo de entrada . A 
Flujo de salida Dispersión a la entrada 
2: PP kVc (32.1) 
dx Ox dx 2 


Reacción de decaimiento 


Dispersión a la salida 


donde V = volumen (m'), O = flujo volumétrico (m*/h), c = concentración (moles/m”), D es un coefi- 
ciente de dispersión (m?/h), A, es el área de la sección transversal del reactor (m?) y k es el coeficien- 
te de decaimiento de primer orden (h”'). Observe que los términos de dispersión están basados en la 
primera ley de Fick, 


Flujo = pe (32.2) 
Ox 


que es análoga a la ley de Fourier para la conducción del calor [recuerde la ecuación (29.4)]. Esta 
ecuación especifica que la turbulencia de mezclado tiende a mover la masa desde regiones de alta 
hasta las de baja concentración. El parámetro D, por lo tanto, determina la magnitud de la turbulen- 
cia de mezclado. 

Si Ax y Af tienden a cero, la ecuación (32.1) será 


=D U kc (32.3) 


donde U = Q/A, es la velocidad del agua que fluye a través del reactor. El balance de masa de la fi- 
gura 32.1, por lo tanto, se expresa ahora como una ecuación diferencial parcial parabólica. En oca- 
siones, a la ecuación (32.3) se le llama la ecuación de advección-dispersión con reacción de primer 
orden. En estado estacionario, se reduce a una EDO de segundo orden, 


2 2 
E 62.4) 


0 2 
dx dx 


Antes de £ = 0, el reactor se llena con agua libre de la sustancia química. En f£= 0, se inyecta la 
sustancia química en el flujo de entrada del reactor a un nivel constante de c.,. Así, se tienen las si- 
guientes condiciones de frontera: 


Co 


QC o, E Oc, a DA. E 
dx 


c(L,t)=0 


La segunda condición especifica que la sustancia sale del reactor simplemente como una función del 
flujo a través del tubo de salida. Es decir, se supone que la dispersión en el reactor no afecta la ve- 
locidad de salida. Bajo estas condiciones, utilice los métodos numéricos para resolver la ecuación 
(32.4) en niveles de estado estacionario para el reactor. Observe que se trata de un problema de EDO 
con valores en la frontera. Después resuelva la ecuación (32.3) para caracterizar la respuesta transi- 
tiva (es decir, cómo cambian los niveles con el tiempo conforme el sistema se aproxima al estado 
estacionario). Esta aplicación utiliza una EDP. 


Solución Se desarrolla una ecuación en estado estacionario sustituyendo la primera y la segunda 
derivadas de la ecuación (32.4) por diferencias finitas centradas para obtener 
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Cj,1=20,+C),_; Cir C1 
D de. > U U + U ke, 
x Xx 


o 
ll 


Agrupando términos se tiene 


D 1 2D KkAx D 1 
= += C;_1 + + Co Ci+1 = 0 (32.5) 
UAx 2 UAx U UAx 2 


Esta ecuación se puede dar para cada uno de los nodos del sistema. En los extremos del reac- 
tor, este proceso introduce nodos que están fuera del sistema. Por ejemplo, en el nodo de entrada 
(i =0), 


D 1 2D kAx D 1 
+ je, + + Co c;=0 (32.6) 
UAx 2 U Ax U UAx 2 


El término c_, se elimina utilizando la primera condición de frontera. A la entrada, se debe 
satisfacer el siguiente balance de masa: 


QC. = Qc,- DA, El 

dx 

donde c, = concentración en x = 0. Así, esta condición de frontera especifica que la cantidad de 
sustancia química transportada hacia el tanque por advección a través del tubo debe ser igual a la 
cantidad llevada hacia afuera desde la entrada, tanto por advección como por dispersión de turbu- 
lencia en el reactor. Se sustituye la derivada por una diferencia dividida finita 


Ci=€ 
C., =0c, - DA, == 
Y en 0 0 C 2 Ax 


De la cual se despeja c_, 


2AxU 2AxU 
Con C 
D D 


C_ =C + 


que al sustituirse en la ecuación (32.6) se obtiene 


2D ,kAx,,, MU) (2D 4220), ad 
U Ax U D 0 1 en ( 7) 


Se puede realizar un desarrollo similar para la salida, donde la ecuación en diferencias original es 


el Sr, pe O, ¡+ 2D ¿HAx C,, D 1 C,,1=0 (32.8) 
UAx 2 U Ax U UAx 2 


La condición de frontera a la salida es 


dc, a 


cc, — DA 
Q n Cc dx 


Oc, 


Como en la entrada, se utiliza una diferencia dividida para aproximar la derivada, 


Oc, - DA E 0) (32.9) 
C ==: _—— — ms td C . 
Ñ “  2Ax ss 


32.1 Balance de masa unidimensional de un reactor (ingeniería química/bioingeniería) 


Una inspección de esta ecuación nos lleva a concluir que 
C,..1=C,_ En otras palabras, la pendiente a la salida debe 
ser cero para que se satisfaga la ecuación (32.9). Sustitu- 
yendo este resultado en la ecuación (32.8) y simplificando, 


se tiene 
dy. + E + EL =0 (32.10) 


Las ecuaciones (32.5), (32.7) y (32.10) forman ahora 
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un sistema tridiagonal de n ecuaciones con n incógnitas. 0 2.5 5 
Por ejemplo, si D=2, U=1, Ax=2.5, k=0.2 y c,, = 100, 
el sistema es 


Figura 32.2 
Concentración contra distancia a lo largo del eje longitudinal de 
5.35 -1.6 Co 325 un reactor rectangular para una sustancia química que decae con 
-13 21 -—03 C 0 cinética de primer orden. 
-13 21 -03 cap=3 0 
-13 21 -—03||c, 0 
-1.6 2.1 ||c, 0 


de donde se obtiene 


c,=76.44 e, =52.47 c,= 36.06 e, = 25.05 c,= 19.09 


La gráfica de estos resultados se muestra en la figura 32.2. Como se esperaba, la concentración 
disminuye debido a la reacción de decaimiento, conforme la sustancia química fluye a través del 
reactor. Además del cálculo anterior, la figura 32.2 muestra otro caso con D = 4. Observe cómo 
aumentando la turbulencia de mezclado la curva tiende a ser plana. 

En cambio, si se disminuye la dispersión, la curva será más pronunciada conforme el mezclado 
sea menos importante en relación con la advección y el decaimiento. Debe notarse que si la disper- 
sión disminuye demasiado, el cálculo estará sujeto a errores numéricos. Este tipo de error se conoce 
como inestabilidad estática, en contraste con la inestabilidad dinámica debida a largos lapsos de 
tiempo durante un cálculo dinámico. El criterio para evitar esta inestabilidad estática es 

Ma 

U 
Así, el criterio se vuelve más riguroso (con una Ax más baja) para los casos donde la advección do- 
mina sobre la dispersión. 

Además de los cálculos en estado estacionario, los métodos numéricos se utilizan para generar 
la solución variable con el tiempo de la ecuación (32.3). La figura 32.3 muestra los resultados para 
D=2,U=1,Ax=2.5,k=0.2 y c,, = 100, donde la 
concentración en el tanque es O en el instante cero. Como 
se esperaba, el impacto inmediato ocurre cerca de la 
entrada. Con el tiempo, la solución se aproxima al nivel 
de estado estacionario. 100 + 

Debe observarse que, en tales cálculos dinámicos, 
el lapso de tiempo está restringido por un criterio de 
estabilidad expresado como (Chapra, 1997) 


Figura 32.3 

Concentración contra distancia a diferentes instantes, 
durante la acumulación de la sustancia química en un 
reactor. 0 


Estado estacionario 


10 
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Af< o 
2D+k(Ax) 


Así, el término de la reacción actúa para hacer más pequeño el lapso de tiempo. 


32.2 DEFLEXIONES DE UNA PLACA 
(INGENIERÍA CIVIL/AMBIENTAL) 


Antecedentes Una placa cuadrada, apoyada simplemente en sus extremos está sujeta a una car- 
ga por unidad de área q (figura 32.4). La deflexión en la dimensión z se determina resolviendo la 
EDP elíptica (véase Carnahan, Luther y Wilkes, 1969) 
4 4 4 
PE 00 y e 2 (32.11) 
Ox dx “dy” dy D 


sujeta a condiciones de frontera en los extremos, donde la deflexión y la pendiente normal a la fron- 
tera son cero. El parámetro D es la rigidez de flexión, 


E Az? 


= 57 32.12 
121-067) (aa 


donde E = el módulo de elasticidad, Az = el espesor de la placa y O = razón de Poisson. 
Si definimos una nueva variable como sigue 


La ecuación (32.11) se reexpresa como 


du Yu q 
37 7D (32.13) 


Por lo tanto, el problema se reduce a resolver de manera sucesiva dos ecuaciones de Poisson. Prime- 
ro, de la ecuación (32.13) se obtiene u sujeta a la condición de frontera u=0 en los extremos. Después, 
los resultados se emplean junto con 


2 2 
o + Ss =u (32.14) 
para obtener z sujeta a la condición de que z = 0 en los extremos. 

Desarrolle un programa computacional para determinar las deflexiones de una placa cuadrada 
sujeta a una carga constante por unidad de área. Pruebe el programa con una placa de 2 metros de 
longitud en sus extremos, q = 33.6 kN/m?, O =0.3, Az= 10? m y E=2x 10"! Pa. Emplee Ax = Ay = 
0.5 m para su corrida de prueba. 


Solución Las diferencias divididas finitas se emplean para 
sustituir cada uno de los sumandos en la ecuación (32.13) para dar 


y 
Uy ¡224,44 4,24, +4. 
i+1j a i-1,) dj ij+l a i,j—1 a q (32.15) 
Ax Ay D 
on ] 
; E Figura 32.4 
l Placa cuadrada apoyada en forma simple, sujeta a una carga en la 


superficie. 


32.3 Problemas de campo electrostático bidimensional (ingeniería eléctrica) 715 


La ecuación (32.12) se utiliza para calcular D = 1.832 x 10* N/m. Este resultado, junto con los otros 
parámetros del sistema, se sustituyen en la ecuación (32.15) para obtener 


u  +u  +u.  +u  —4u =0.458 
i+1)j i-1)j ij+l ij—1 7] 


Esta ecuación se puede dar para todos los nodos con las fronteras en u= 0. Las ecuaciones resultan- 
tes son 


4 1 1 4; 0.458 

1 4 1 1 a 0.458 

1 4 1 U3; 0.458 

1 4 1 1 UL) 0.458 

1 1 4 1 1 U> 2 y =30.458 

1 1 4 1 fu, 0.458 

1 4 1 43 0.458 

1 1 4 1jjo, 0.458 

L 1 1 —4][u5 0.458 

de las cuales se obtiene 

u,,=-0.315 u, , =-0.401 u, ,=-0.315 
u,  =-0.401 u, , =-0.515 u, ,=-0.401 
u,, =-0.315 u, , =-0.401 u, ,=-0.315 


Estos resultados, a su vez, se sustituyen en la ecuación (32.14), que se escribe en forma de diferencias 
finitas para obtener 


7, = 0.063 2, =0.086 2, = 0.063 
2, = 0.086 z,, =0.118 2, = 0.086 
2, = 0.063 2, = 0.086 2, = 0.063 


32.3 PROBLEMAS DE CAMPO ELECTROSTÁTICO BIDIMENSIONAL 
(INGENIERÍA ELÉCTRICA) 


Antecedentes Así como la ley de Fourier y el balance de calor se emplean para caracterizar la 
distribución de temperatura, existen relaciones análogas para modelar problemas en otras áreas de 
la ingeniería. Por ejemplo, los ingenieros eléctricos usan un método similar cuando modelan campos 
electrostáticos. 

Bajo varias suposiciones de simplificación, un análogo de la ley de Fourier se representa en 
forma unidimensional como 


donde D se conoce como el vector de densidad de flujo eléctrico, e = permitividad eléctrica del 
material y V= potencial electrostático. 

De manera similar, una ecuación de Poisson para campos electrostáticos se representa en dos 
dimensiones de la siguiente manera 


A P, 
dx? Oy” € 
donde p, = densidad de carga volumétrica. 


Por último, en regiones que no contienen carga libre (es decir, p,, = 0), la ecuación (32.16) se 
reduce a la ecuación de Laplace, 


(32.16) 
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vv 0v 
PRADA (32.17) 
ox? dy 
Emplee métodos numéricos para resolver la ecuación (32.17) para la situación mostrada en la 
figura 32.5. Calcule los valores para V y para D sig =2. 
Solución Usando el procedimiento que se describe en la sección 29.3.2, la ecuación (29.24) para 
el nodo (1, 1) se escribe como 
2 Vo ll Vo + Vi o Va E 2 Vi A Vos + Vo E Ya _ 
Ar? 0/(0,+0,) 0,(0,+0,) Ay” BB, +B,) P,(B, + B,) 
De acuerdo con la geometría ilustrada en la figura 32.5, Ax=3, Ay=2,P,=P,=0,=1 ya, =0.94281. 
Sustituyendo estos valores se obtiene 
0.12132V, ,-121,32+0,11438V, ,—0.11438V,, +0.23V,, 
+ 0.25V, , -0.25 V,,=0 
Agrupando términos se tiene 
0.73570V, , - 0.11438V,  - 0.25V, , = 121.32 
Un procedimiento similar se aplica a los nodos interiores restantes. Las ecuaciones simultáneas 
resultantes se expresan en forma matricial como 
[ 0.73570  -0.11438 —0.25000 1 
-0.11111 0.72222  -—0.11111 —0.25000 
—0.11438 0.73570 —0.25000 
—0.31288 1.28888  -0.14907 
—0.25000 -0.11111.  0.72222  -—0.11111 
L -0.31288 -0.14907  1.28888 | 
Ya 121.32 
Va 0 
Y. 121.32 
Xx = 
1000 Vo 826.92 
Vo 250 
1000 > 6 Vio 826.92 
y 
3 las cuales se resuelven para obtener 
0 0 V,,=521.19 v,  =421.85 v, =3521.19 
a) V, ,=855.47 V,, =755.40 V,, = 855.47 


Estos resultados se representan en la figura 32.64. 
Para calcular el flujo (recuerde la sección 29.2.3), las ecuaciones (29.14) 
y (9.15) deben modificarse para tomar en cuenta las fronteras irregulares. 


En este ejemplo, las modificaciones dan por resultado 


Figura 32.5 


a) Sistema en dos dimensiones con un voltaje de 1000 a lo largo de la fronte- 
ra circular y un voltaje de O a lo largo de la base. b) Esquema de numeración 
nodal. 
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— Vero 7 Y, 


(0, +0,)Ax 


v, 


jr 


V, 


ji 


D, = -€ == 
j (B, + B,)Ay 


i-Lj 1000 


En el nodo (1, 1), estas fórmulas se utilizan para calcular las componentes 
x y y del flujo 


Resultados de la ecuación de Laplace con factores 


421.85-— 
y 85 1000 _ 98.4 
: (0.94281+1)3 
y 
qe, 855.470 _ 4077 M 
á (1+1)2 N 
las cuales se usan para calcular el vector de densidad de flujo eléctrico 
D= ,/198.4? +(427.1? =471,5 
con una dirección de Figura 32.6 
di A2ZTTN o de corrección para las fronteras irregulares. 
tan 198.4 65. a) Potencial y b) flujo. 


Los resultados para los demás nodos son 


Nodo D, D, D 0 

2,1 0.0 -377.7 377.1 -90 
3,1 -198.4 -427.7 471.5 245.1 
1,2 109.4 -299.6 281.9 -69.1 
2,2 0.0 -289.1 289.1 -90.1 
3,2 -109.4 -299.6 318.6 249.9 


Los flujos se muestran en la figura 32.6b. 


32.4 SOLUCIÓN POR ELEMENTO FINITO DE UNA SERIE 
DE RESORTES (INGENIERÍA MECÁNICA/AERONÁUTICA) 


Antecedentes En la figura 32.7 se presenta una serie de resortes conectados entre sí. Un extremo 
está fijo a una pared; mientras que el otro está sujeto a una fuerza constante F. Usando el procedi- 
miento paso por paso, descrito en el capítulo 31, se puede emplear un método por elemento finito 
para determinar los desplazamientos de los resortes. 


Solución 


Discretización. La forma de dividir este sistema es, obviamente, tratar cada resorte como un 
elemento. Así, el sistema consiste de cuatro elementos y cinco nodos (figura 32.7b). 


Ecuaciones de los elementos. Como este sistema es muy simple, las ecuaciones de sus elementos 
se pueden dar directamente, sin recurrir a aproximaciones matemáticas. Éste es un ejemplo del 
procedimiento directo para deducir elementos. 

En la figura 32.8 se muestra un solo elemento. La relación entre la fuerza F y el desplazamien- 
to x se representa matemáticamente por la ley de Hooke: 
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fijo a una pared, mientras que el otro está sujeto a una 
fuerza constante F. b) Representación del elemento finito. 
Cada resorte representa un elemento. Por lo tanto, el siste- 
ma consiste de cuatro elementos y cinco nodos. 


7) Figura 32.7 
Fuerza a) Serie de resortes conectados entre sí. Un extremo está 


Nodo 


a 
N 
w 
ÉS 
al 


e . . . . F=kx 


donde k = la constante del resorte, que se interpreta como la 
fuerza requerida para causar un desplazamiento unitario. Si 
una fuerza FF, se aplica al nodo 1, el siguiente balance de 
fuerzas debe satisfacerse: 


F=k(x, -x,) 


Elemento 
b) 


donde x, = desplazamiento del nodo 1 desde su posición de equilibrio y x, = desplazamiento del nodo 
2 desde su posición de equilibrio. Así, x, — x, representa cuánto se ha alargado o comprimido en 
relación con el equilibrio (figura 32.8). 

Esta ecuación también se puede escribir como 


F, = kx, — kx, 


Para un sistema en estado estacionario, un balance de fuerzas también necesita que F, =—F, y, por 
lo tanto, 


F,= =kx, + kx, 


Estas dos ecuaciones simultáneas especifican el comportamiento del elemento en respuesta a las 
fuerzas dadas. Se escriben en forma matricial como 


k lx] _fA 
-k kllaj 12 
[k](x) = (4) (32.18) 


donde la matriz [k] es la matriz de las propiedades del elemento; en este caso, también se conoce como 
matriz de rigidez del elemento. Observe que la ecuación (32.18) se presenta en el formato de la ecua- 
ción (31.9). Así, se logró generar una ecuación matricial que describe el comportamiento de un ele- 
mento típico en nuestro sistema. 

Antes de continuar con el siguiente paso (el ensamble de la solución total), presentaremos algu- 
na notación. A los elementos de [k] y [F'] se les colocan, de manera convencional, superíndices y 
subíndices: 


| Ko El (5) (ho) 

(e) (e) =p 
—k>; K> *, B 
donde el superíndice (e) indica que éstas son las ecuaciones del 
elemento. A las k también se les han puesto subíndices como Kk, 
para denotar su localización en el ¿-ésimo renglón y la j-ésima 


columna de la matriz. En este caso, también se interpretan física- 
mente como representación de la fuerza requerida en el nodo i 


Figura 32.8 


Diagrama de cuerpo libre de un sistema de resorte. 


x para inducir un desplazamiento unitario en el nodo j. 


Ensamble. Antes de ensamblar las ecuaciones de los elementos, 
deben numerarse todos los elementos y nodos. Este esquema de 
numeración global especifica una configuración o topología del 
sistema. (Observe que en este caso se utiliza un esquema idéntico 
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al de la tabla 31.1.) Es decir, nos dice qué nodos pertenecen a qué elemento. Una vez que se especifica 
la topología, se pueden dar las ecuaciones de cada elemento con referencia a las coordenadas globales. 

Las ecuaciones del elemento se agregan, una por una, para ensamblar todo el sistema. El resul- 
tado final se expresa en forma matricial como [recuerde la ecuación (31.10)] 


[K]() = (F) 


donde 
Pao a | 
D D (Q) 2 
Ln Ko +K; kz 
[x] = HD KAR KZ (32.19) 
3) 3) (4) 4) 
=Kk3; ka +K; ki 
(4 4 
L ka) E J 
y 
E" 
0 
[F']=3 0 
0 
pe 


y [x') y [F”) son los desplazamientos expandidos y vectores de fuerza, respectivamente. Observe 
que, conforme las ecuaciones fueron ensambladas, las fuerzas internas se cancelan. Así, en el resul- 
tado final (F?) tiene cero en todos los nodos, excepto en el primero y en el último. 

Antes de continuar con el siguiente paso, debemos hacer una observación sobre la estructura de 
la matriz de propiedades de ensamble [ecuación (32.19)]. Observe que la matriz es tridiagonal, que 
es un resultado directo del esquema de numeración global particular que se eligió (tabla 31.1) antes 
del ensamblado. Aunque no es muy importante en el presente contexto, la obtención de tal sistema 
disperso en banda puede ser una ventaja decisiva en problemas más complicados. Ello se debe a los 
eficientes esquemas para resolver tales sistemas. 


Condiciones de frontera. El presente sistema está sujeto a una sola condición de frontera, x, =0. 
La introducción de esta condición y la aplicación del esquema de renumeración global reduce el 
sistema a (todas las k = 1) 


2 -1 Xx, 0 
00% al x. 1 10 
E 

-1 1 lx F 


El sistema ahora tiene la forma de la ecuación (31.11) y está listo para resolverse. 

Aunque la reducción de las ecuaciones es ciertamente un método correcto para incorporar 
condiciones de frontera, por lo común se prefiere dejar intacto el número de ecuaciones cuando se 
obtiene la solución en la computadora. Sea cual fuere el método, una vez que se incorporan las con- 
diciones de frontera, es posible llegar al paso siguiente: la solución. 


Generación de la solución. Usando uno de los procedimientos de la parte tres, tal como la efi- 

ciente técnica de solución tridiagonal descrita en el capítulo 11, el sistema se resuelve para obtener 

(con todas las k=1 y F=1) 
x,=1 x=2 x,=3 x.=4 

Procesamiento posterior. Los resultados pueden mostrarse ahora en forma gráfica. Como en la fi- 

gura 32.9, los resultados son los que se esperaban. Cada resorte se estira un desplazamiento unitario. 
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A 

a) Y WN—o—MP—o—MP—o—MP—O 
| === x=4 
1=3 Figura 32.9 
x=2 a) El sistema de resortes original. b) El sistema 
Y x= dl E después de la aplicación de una fuerza constan- 
te. Los desplazamientos se indican en el espacio 
b o Hp 
d NP VIP VO NP entre los dos sistemas. 

A 

PROBLEMAS 


Ingeniería química/bioingeniería 

32.1 Realice el mismo cálculo de la sección 32.1, pero ahora use Ax 
=.1,25, 

32.2 Desarrolle una solución por elemento finito para el sistema en 
estado estacionario de la sección 32.1. 

32.3 Calcule los flujos de masa para la solución en estado estacio- 
nario de la sección 32.1 usando la primera ley de Fick. 

32,4 Calcule la distribución en estado estacionario de la concentra- 
ción en el reactor mostrado en la figura P32.4. La EDP que rige este 
sistema es 


y las condiciones de frontera son las que se muestran. Emplee un 
valor de 0.5 para D y 0.1 para k. 


k 30 » 


c=40 10 
| / 
Frontera ' 7 
A e= 100 
abierta Pared 
10 — 
Figura P32.4 


32.5 Entre dos placas hay una separación de 10 cm, como se mues- 
tra en la figura P32.5. Inicialmente, ambas placas y el fluido están en 
reposo. En £=0, la placa superior se mueve con una velocidad cons- 
tante de 8 cm/s. Las ecuaciones que rigen los movimientos de los 
fluidos son 


2 2 
ei = mí d Vaocite y A == d Vagua 
aceite 2 agua 2 
ot acelte Ox dt agua Ox 
y las siguientes relaciones se satisfacen en la interfaz aceite-agua 
dv 
= aceite __ agua 
Vaocite — agua 


y Maccite Ox > Magna dx 


¿Cuál es la velocidad de las dos capas de fluido en1=0.5,1y1.5s, 
a las distancias x = 2, 4, 6 y 8 cm de la placa inferior? Observe que 
Mara Y Maceo = 1 y 3 Cp, respectivamente. 


y 
10 
Sl Aceite 
6 
Ar— 
a Agua 


Figura P32.5 


32.6 El desplazamiento de una membrana uniforme sujeta a una 

tensión y una presión uniforme se puede describir por la ecuación de 

Poisson 
0% 
dx? 


9% P 

dy T 

Despeje el desplazamiento de una membrana cuadrada de 1 cm que 
tiene P/T = 0.6/cm y está fijada de modo que tiene desplazamiento 
cero a lo largo de sus cuatro fronteras. Utilice Ax = Ay = 0.1 cm. 
Muestre sus resultados como una gráfica de contorno. 


Ingeniería civil/ambiental 
32.7 Ejecute el mismo cálculo que en la sección 32.2, pero utilice 
Ax=Ay=0.4 m. 
32.8 El flujo a través de medios porosos queda descrito con la ecua- 
ción de Laplace 
2 2 

oh + oh =0 

dx? dy 
donde h es la carga. Use métodos numéricos para determinar la dis- 
tribución de la carga para el sistema que se muestra en la figura P32.8. 
32.9 La velocidad del flujo del agua a través de los medios porosos 
se relaciona con la carga por medio de la ley de D'Arcy 


donde K es la conductividad hidráulica y q, es la velocidad de des- 
carga en la dirección n. Si K=5 x 10* cm/s, calcule la velocidad del 
agua para el problema 32.8. 


Ingeniería eléctrica 
32.10 Realice el mismo cálculo que en la sección 32.3, pero para el 
sistema que se ilustra en la figura P32.10. 


57 =0 
h=20 | 
2 =1 2 
%=0 
3 =0 
L, 2 Lg =3 


Figura P32.8 


32.11 Lleve a cabo el mismo cálculo que en la sección 32.3, pero 
para el sistema que se muestra en la figura P32.11. 


9 _ 
o 


Figura P32.11 


32.12 Use la ecuación de Poisson para calcular el potencial eléctrico 
sobre una placa cuadrada unitaria (1 x 1) con voltaje cero en las 
orillas y fuentes puntuales de carga de p,/e(0.7, 0.7) = 1 y p,/e(0.3, 
0.3) = —1. Utilice Ax= Ay = 0.1 y muestre sus resultados como grá- 
fica de contorno. 


Ingeniería mecánica/aeroespacial 
32.13 Lleve a cabo el mismo cálculo que en la sección 32.4, pero 
cambie la fuerza a 1.5 y las constantes de los resortes a 


Resorte | 1 2 3 4 
k | 075 1.5 0.5 a 


32.14 Efectúe el mismo cálculo que en la sección 32.4, pero utilice 
una fuerza de 2 y cinco resortes con 


Resorte | 1 2 3 4 5 
k | 025 05 15 0.75 1 


32.15 Una barra compuesta y aislada está formada por dos partes 
sujetas extremo con extremo, ambas con la misma longitud. La par- 
te a tiene conductividad térmica k,, para O <x <a, y la parte b tiene 
conductividad térmica k,, para Y? < x< 1. Las ecuaciones de conduc- 
ción de calor transitivas no dimensionales que describen la tempera- 
tura u en la longitud x de la barra compuesta son 
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V=40 
V=20 
o . El 
v=10 
V=10 o 0] o IN 
a [a => 
. . e e V=5 
vV=0 
Figura P32.10 
%u du 
==>— 0<x<l/2 
ox” ot 
Yu du 
=— 1/2<x<l 
ar a ds 


donde u = temperatura, x = coordenada axial, f = tiempo y r =k,/Kk,. 
Las condiciones iniciales y de frontera son 


Condiciones de frontera u(0, t)=1 u(1,0=1 
du| fou ia 
9x), Lox), dd 
u(x, 0)=0 O<x<1 


Condiciones iniciales 


Resuelva este conjunto de ecuaciones para la distribución de tempe- 
ratura como función del tiempo. Utilice análogos de diferencias fini- 
tas exactas de segundo orden para las derivadas, con formulación de 
Crank-Nicolson, para integrar en el tiempo. Escriba un programa 
de computadora para la solución, y seleccione valores de Ax y At para 
una buena exactitud. Grafique la temperatura u versus la longitud x 
para distintos valores de tiempo f. Genere una curva separada para los 
valores siguientes del parámetro r= 1, 0.1, 0.01, 0.001 y O. 
32.16 Resuelva la ecuación de conducción del calor transitiva no di- 
mensional en dos dimensiones, que representa la distribución de 
temperatura transitiva en una placa aislada. La ecuación gobernante es 
du Yu du 

F—==— 

dx dy ot 

donde u = temperatura, x y y son las coordenadas espaciales y 
t = tiempo. Las condiciones iniciales y de frontera son 


Condiciones de frontera u(x, 0, t) =0 


u(x, 1,t)=1 
u(0 y, t)=0 ut, y,t)=1 
Condiciones iniciales u(x, y, 0)=0 


O<x<1 O<y<1 


Resuelva con el empleo de una técnica alternativa de dirección im- 
plícita. Escriba un programa de cómputo para implementar la solu- 
ción. Grafique los resultados con el uso de una rutina graficadora de 
tres dimensiones en la que el plano horizontal contenga los ejes x y 
y, y el eje z es la variable dependiente u. Haga varias gráficas en 
distintos tiempos, incluyendo lo siguiente a) las condiciones iniciales; 
b) un tiempo intermedio, aproximadamente a la mitad del camino 
hacia el estado estable y c) la condición de estado estable. 


EPÍLOGO: PARTE OCHO 


PT8.3 ALTERNATIVAS 


Las principales ventajas y desventajas asociadas a los métodos numéricos para la solución de ecua- 
ciones diferenciales parciales implican seleccionar entre procedimientos por diferencias finitas y 
por elemento finito. Los métodos por diferencias finitas son conceptualmente más fáciles de com- 
prender. Además, son de fácil programación en sistemas que pueden ser aproximados con mallas 
uniformes. Sin embargo, son difíciles de aplicar a sistemas con geometrías complicadas. 

Los procedimientos por diferencias finitas se dividen en categorías, dependiendo del tipo de 
EDP que se vaya a resolver. Las EDP elípticas pueden aproximarse por medio de un conjunto 
de ecuaciones algebraicas lineales. En consecuencia, el método de Liebmann (que, de hecho, es el 
método de Gauss-Seidel) se utiliza para obtener una solución de manera iterativa. 

Las EDP parabólicas en una dimensión se resuelven de dos maneras fundamentalmente dife- 
rentes: con métodos explícitos o con métodos implícitos. El método explícito se desarrolla en el 
tiempo de una forma similar a la técnica de Euler para resolver las EDO. Tiene la ventaja de que se 
programa fácilmente, aunque presenta el inconveniente de tener un criterio de estabilidad muy es- 
tricto. En cambio, existen métodos implícitos que, por lo general, implican la solución de ecuaciones 
algebraicas tridiagonales de manera simultánea en cada iteración. Uno de esos procedimientos, el 
método de Crank-Nicolson, es muy preciso y estable, y, por lo tanto, es muy utilizado en problemas 
parabólicos lineales en una dimensión. 

Las EDP parabólicas en dos dimensiones también se modelan de manera explícita. Aunque sus 
restricciones de estabilidad son aún más estrictas que en el caso de una dimensión. Se han desarro- 
llado procedimientos implícitos especiales (generalmente conocidos como métodos de separación) 
para evitar dicho inconveniente. Estos procedimientos son eficientes y estables. Uno de los más 
comunes es el método implícito de dirección alternante o IDA. 

Todos los procedimientos por diferencias finitas anteriores se vuelven complicados cuando se 
aplican a sistemas con formas no uniformes y condiciones heterogéneas. Existen métodos por ele- 
mento finito que funcionan mejor para tales sistemas. 

Aunque el método del elemento finito se basa en ideas muy sencillas, el mecanismo para gene- 
rar un buen código del elemento finito para problemas en dos y tres dimensiones no es un ejercicio 
trivial. Además, llega a ser costoso en términos computacionales para problemas grandes. Sin em- 
bargo, es muy superior a los procedimientos por diferencias finitas para sistemas con formas com- 
plicadas. En consecuencia, a menudo se justifica su costo debido a su concepto “superior” en el 
detalle de la solución final. 


PT8.4 RELACIONES Y FÓRMULAS IMPORTANTES 


En la tabla PT8.3 se resume la información importante que fue presentada en la parte ocho respec- 
to de los métodos por diferencias finitas. Esta tabla es útil para lograr un rápido acceso a relaciones 
y fórmulas importantes. 


PT8.5 MÉTODOS AVANZADOS Y REFERENCIAS ADICIONALES 


Carnahan, Luther y Wilkes (1969); Rice (1983); Ferziger (1981), y Lapidus y Pinder (1982) ofrecen 
análisis útiles de los métodos y del software para resolver EDP. También se recomienda consultar 
Ames (1977), Gladwell y Wait (1979), Vichnevetsky (1981, 1982) y Zienkiewicz (1971) para estudios 
más profundos. Existe información adicional sobre el método del elemento finito en Allaire (1985), 
Huebner y Thornton (1982), Stasa (1985) y Baker (1983). Además de las EDP elípticas e hiperbólicas, 
también existen métodos numéricos para resolver EDP hiperbólicas. Se encuentran buenas introduc- 
ciones y resúmenes de algunos de tales métodos en Lapidus y Pinder (1981), Ferziger (1981), Forsythe 
y Wasow (1960) y Hoffman (1992). 


PT8.5 Métodos avanzados y referencias adicionales 


Tabla PT8.3 Resumen de los métodos por diferencias finitas. 


Molécula computacional Ecuación 
p 
es ,j+1 T aj a jos 
étodo de 7) A 
Liebmann 
O O 
i-1, EJ i+1,) 
1 

EDP parabólicas 141 E 
(en una dimensión) 

Método 

explícito 

O O 
i-1,1 Ll i+1,/ 
Método I+ I+ l+ 
implícito TO E O ATA +4 (14220) -AT/0 =T/ 
Ll 
Método de - AT 2(14 JT ATA 
Crank-Nicolson ¿= il, Dabil Ús ' i ' 
¡ =AT,_,+2(1-A)T,+4AT,,, 
Oi l+ el 


i= il, il i+1,1 
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PAS UA al 


La serie de Fourier 


La serie de Fourier puede expresarse de diferentes maneras. 
Dos expresiones trigonométricas equivalentes son 


FO=a,+ Na, cos(k0,t) + b, sen(k0,t)] 


k=1 


FO=a, + S fe, cos(kw,t+0,)] 


k=1 


donde los coeficientes están relacionados mediante (véase 
figura A.l) 


C; =. laz +bí 


0,= um [2] 
a, 


Además de las formas trigonométricas, las series también 
se expresan en términos de la función exponencial, 


fO=5 + Vleeo+z [to] (AD) 
k=1 


oí by 


A; 


Figura A.1 
Relaciones entre las formas rectangular y polar de los coeficien- 
tes de la serie de Fourier. 


donde (véase figura A.2) 


Figura A.2 
Relaciones entre coeficientes exponenciales complejos 
y reales de la serie de Fourier. 


1 
E = 70, ib) =0,/e*k 


¿,= 5, + ib,)=|c e *k 


donde lz,| = 4, y 


El= do => 


Observe que la tilde significa que el coeficiente es un número 
complejo. 

Cada término de la ecuación (A.1) puede visualizarse 
como un fasor giratorio (las flechas de la figura A.2). Los 
términos con subíndice positivo giran en sentido contrario a 
las manecillas de un reloj analógico; mientras que los que 
tienen subíndice negativo giran en sentido de las manecillas 
del reloj. Los coeficientes €, y € _, especifican la posición del 
fasor en £ = 0. Entonces, la suma infinita de los fasores, que 
se dejan girar en £= 0, es igual a (0. 


Empecemos con MATLAB 


MATLAB es un programa computacional que ofrece al usuario un ambiente adecuado para diversos 
tipos de cálculos (en particular, aquellos que se relacionan con manipulaciones de matrices). MATLAB 
Opera interactivamente ejecutando, una por una, las instrucciones del usuario, conforme se van in- 
troduciendo. Se puede guardar una serie de instrucciones como un guión y correrlas como un pro- 
grama interpretativo. MATLAB tiene muchas funciones predefinidas; sin embargo, es posible que 
los usuarios construyan sus propias funciones a partir de comandos y funciones de MATLAB. Las 
principales características de MATLAB son cálculos predefinidos con vectores y matrices como: 


+ Aritmética de vectores y matrices 

+ Inversión de matrices y análisis de valores y vectores propios 
+ Aritmética compleja y operaciones con polinomios 

+ Cálculos estadísticos 

» Despliegue de gráficas 

+ Diseño de sistemas de control 

+ Modelos de proceso de ajuste a partir del análisis de datos 


MATLAB tiene diferentes paqueterías que proporcionan funciones especializadas. Éstas inclu- 
yen procesamiento de señales, sistemas de control, identificación de sistemas, optimización y esta- 
dística. 

MATLAB está disponible en versiones para PC, Mac y estaciones de trabajo. La versión mo- 
derna para PC opera en ambiente Windows. Los siete ejercicios siguientes están diseñados para que 
puedan ser calculados con MATLAB); no constituyen un tutorial completo. Existen materiales tuto- 
riales adicionales en los manuales de MATLAB. Un gran número de libros de texto ofrecen ejercicios 
con MATLAB. También se dispone de información en línea para cualquier comando o función, 
tecleando help name, donde name identifica el comando. No se limite solamente a estos ejercicios; 
aparte de probarlos todos, intente las variaciones que se le puedan ocurrir. Compruebe las respues- 
tas que da MATLAB, asegurándose de entenderlas y de que sean correctas. Ésta es la manera más 
efectiva de aprender MATLAB. 


1. Asignación de valores a los nombres de las variables 


La asignación de valores a variables escalares es similar a otros lenguajes de computación. Teclee 


a=4 


A=56 


Observe cómo la asignación se repite para confirmar lo que usted ha hecho. Esta es una caracterís- 
tica de MATLAB. La repetición se elimina terminando la línea de instrucción con un punto y coma 
(;). Teclee 


b.= =3; 


MATLAB considera a los nombres reconociendo mayúsculas y minúsculas; es decir, el nombre a 
no es lo mismo que el nombre A. Para ilustrar esto, introduzca 


a 
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Vea cómo sus valores son distintos. Son nombres distintos. 
En MATLAB, los nombres de las variables generalmente representan cantidades matriciales. 
Un vector renglón se puede asignar como sigue: 


a= [123405] 


Nuevamente la repetición confirma la asignación. Advierta cómo se ha tomado la nueva asignación 
de a. Un vector columna se introduce de varias maneras. Pruébelo. 


b=[Llsy¿Z2p 3 43D] 


] 
o, transponiendo un vector renglón con el operador ” 
b = 11.23.45]? 


Una matriz de valores en dos dimensiones se asigna como sigue: 


A = 123;4565;788] 
lo) 
A = A ES A 

456; 

788 ] 


Los valores almacenados por una variable pueden examinarse en cualquier momento tecleando tan 
sólo el nombre; por ejemplo: 


b 


A 

Además, se obtiene una lista de todas las variables en uso con la instrucción 
who 

O si se quiere con más detalle introduzca 
whos 


Existen algunas variables predefinidas; por ejemplo, pi. 

También se pueden asignar valores complejos a las variables, ya que MATLAB trata automáti- 
camente la aritmética compleja. Para hacerlo, es conveniente asignar un nombre de variable, por lo 
general i o j, para la raíz cuadrada de —1. 


i = sqrt(-1) 
Después se asigna un valor complejo así 


x= 23+ i*4 


2. Operaciones matemáticas 


Las operaciones con cantidades escalares se llevan a cabo de manera directa, como en otros lengua- 
jes de computación. Los operadores comunes, en orden de prioridad, son 


a Exponenciación 

EJ Multiplicación y división 

N División por la izquierda (se aplica a matrices) 
de: Adición y sustracción 
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Estos operadores funcionan como en las calculadoras. Hagamos 
2 * pi 
También se pueden incluir variables escalares reales: 


y =pi/4 
y 5 2:45 


Los resultados de los cálculos pueden ser asignados a una variable (como en los dos penúltimos ejem- 
plos) o tan sólo se despliegan (como en el último ejemplo). 
Los cálculos también pueden utilizar cantidades complejas. Usando la x definida anteriormente, 


3 


xx Ra 


La verdadera potencia de MATLAB se muestra en su capacidad para realizar cálculos con matrices. 
El producto interno de dos vectores (producto punto) se calcula usando el operador * 


a *b 
y, de la misma forma, el producto externo 
b*a 
Para ilustrar la multiplicación de un vector por una matriz, primero redefinimos a y b, 


[ld SS ] 


a 


b=[456 um] 
Ahora, hagamos 


a*A 


A*b 


¿Qué ocurre cuando las dimensiones no son las requeridas por las operaciones? Para verlo, escriba- 
mos 


Ara 

La multiplicación de una matriz por otra matriz se lleva a cabo de forma similar: 
AA 

También se pueden hacer operaciones con escalares: 
A / pi 


Es importante recordar que MATLAB aplicará las operaciones aritméticas simples en forma de 
vector y matriz, si es posible. En ocasiones, usted necesitará realizar los cálculos elemento por ele- 
mento en una matriz o vector. MATLAB también puede hacer esto. Por ejemplo, 


A? 2 


da como resultado una multiplicación matricial de A consigo misma. Pero, ¿qué hacer si queremos 
elevar al cuadrado cada elemento de A? Esto se efectúa con 


BAZA 


El . que precede al operador ” significa que la operación será llevada a cabo elemento por elemento. 
En el manual de MATLAB se le llama operaciones de arreglos. 

Cuando se utiliza el operador división (/) con matrices, el uso de una matriz inversa está implí- 
cito. Por lo tanto, si A es una matriz cuadrada no singular, entonces B/A corresponde a la multipli- 
cación por la derecha de B por la inversa de A. Un camino largo para hacerlo consiste en usar la 
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función inv; es decir, B*inv (A); sin embargo, usar el operador división es más eficiente ya que X = 
B/A en realidad resuelve el conjunto de ecuaciones X*A=B usando un esquema de descomposición/ 
eliminación. 

La “división por la izquierda” (1 , diagonal invertida) se emplea también en las operaciones con 
matrices. Así, AB corresponde a la multiplicación por la izquierda de B por la inversa de A. De esta 
manera se resuelve el conjunto de ecuaciones A*X=B, un cálculo común en ingeniería. 

Por ejemplo si c es un vector columna con valores 0.1, 1.0 y 10, la solución deA * x = c, 
donde A fue definida antes, se obtiene al escribir 


c.= [ 0.1 1:30 10 ]? 
xX=ANXYc 


Inténtelo. 


3. Uso de funciones predefinidas 


MATLAB y sus paqueterías tienen una amplia colección de funciones predefinidas. Usted puede usar 
la ayuda en línea para encontrar más información acerca de ellas. Una de sus propiedades importan- 
tes es que operan directamente sobre cantidades vectoriales y matriciales. Por ejemplo, intente 


log(A) 
y verá que la función logaritmo natural se aplica en un estilo de arreglo, elemento por elemento, a la 
matriz A. La mayoría de las funciones, como sqrt, abs, sin, acos, tanh, exp, operan en forma de arre- 


glo. También ciertas funciones, como la exponencial y la raíz cuadrada, tienen definiciones de matriz. 
MATLAB evaluará la versión matricial cuando se agregue la letra m al nombre de la función. Intente 


sgrtm(A) 
Un uso común de las funciones consiste en evaluar una fórmula para una serie de argumentos. Cons- 
truya un vector columna t que contenga valores desde O hasta 100 a intervalos de 5, 
tt = 103300 400 p* 
Compruebe el número de entradas en el arreglo t con la función Length, 
length (t) 
Ahora, supongamos que quiere evaluar una fórmula y = £(t), donde la fórmula se calcula para 


cada valor del arreglo de t, y el resultado se asigna a una posición correspondiente en el arreglo y. 
Por ejemplo, 


y =t .?* 0.34 -— logl0(t) + 1 ./ t 


¡Listo! [Observe el uso de los operadores del arreglo adyacentes a los puntos decimales.] Esto es 
similar a crear una columna con los valores t en una hoja de cálculo, y copiar una fórmula en una 
columna adyacente para evaluar los valores de y. 


4. Gráficas 


Las capacidades gráficas de MATLAB son similares a las de un programa en una hoja de cálculo. 
Las gráficas se crean rápida y de manera conveniente; sin embargo, no hay mucha flexibilidad para 
personalizarlas. 

Por ejemplo, para crear una gráfica de los arreglos t, y anteriores, introduzca 


plot (t, y) 
¡Eso es! Ahora usted puede personalizar un poco la gráfica utilizando los siguientes comandos: 


title('Grafica de y contra t') 
xlabel ('valores de t') 

ylabel ('valores de y') 

grid 
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La gráfica aparece en otra ventana y puede imprimirse o transferirse a través del portapapeles (PC 
con Windows o Mac) a otros programas. 

Existen otras características de las gráficas que serán de utilidad: trazo de gráficas de objetos 
en lugar de líneas, familias de curvas, trazo de gráficas en el plano complejo, ventanas de gráficas 
múltiples, gráficas log-log o semilog, gráficas tridimensionales y gráficas de contorno. 


5. Polinomios 


Existen muchas funciones de MATLAB que le permiten operar sobre los arreglos como si sus en- 
tradas fueran coeficientes o raíces de ecuaciones polinomiales. Por ejemplo, introduzca 


c= [1111] 
y después 
r = roots(c) 


y las raíces del polinomio x* + 1?+x+1=0 se imprimirán y además se almacenarán en el arreglo 
r. Los coeficientes de un polinomio pueden calcularse a partir de las raíces con la función poly, 


poly (1) 

y un polinomio puede evaluarse para un valor dado de x. Por ejemplo, 
polyval (c, 1.32) 

Si otro polinomio, 2x? — 0.4x — 1, se representa por el arreglo d, 
d= [2 -0.4 -1 ] 


los dos polinomios pueden multiplicarse simbólicamente con la función convolución, conv; para 
obtener los coeficientes del producto polinomial, escriba 


cd = conv(c, d) 
La función de deconvolución, deconv, sirve para dividir un polinomio entre otro; por ejemplo, 
[ q,r ] = deconv(c,d) 


El resultado q es el cociente, y el resultado r es el residuo. 
Existen otras funciones polinomiales que son de utilidad, como la función residuo, que da la 
expansión en fracciones parciales. 


6. Análisis estadístico 


Los paquetes estadísticos contienen muchas características para el análisis estadístico; sin embargo, los 
cálculos estadísticos comunes se realizan con el conjunto básico de funciones de MATLAB. 
Usted puede generar una serie de números (seudo) aleatorios con la función rand. Se dispone de una 
distribución uniforme o normal: 


n=0:5: 1000 ;5 
(¡Olvidó el ; !) 
num = rand(size(n)) ; 


Probablemente entendió por qué es importante usar punto y coma al final de las instrucciones ante- 
riores, en especial si no tuvo cuidado de usarlo. 
Si desea ver una gráfica de ruido intente 


plot (num) 


Se supone que éstos son números distribuidos normalmente con una media de cero y una varianza 
(y desviación estándar) de uno. Compruébelo mediante 
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mean (num) 


std (num) 
¡Nadie es perfecto! Usted puede hallar los valores mínimos y máximos, 


min (num) 
max (num) 


Hay una función adecuada para trazar un histograma de los datos: 
hist (num, 20) 


donde 20 es el número de compartimientos. 
Si quiere ajustar un polinomio para algunos datos por mínimos cuadrados, utilice la función 
polyfit. Intente el siguiente ejemplo: 


t= 05 
y = [ -0.45 0.56 2.34 5.6 9.45 24.59 ] 
coef = polyfit( t, y, 3 ) 


Los valores de coef son los coeficientes del polinomio ajustados. Para generar el valor calculado 
de y, 


yc = polyval( coef,t ) 
y para graficar los datos contra la curva ajustada, 
plot ( t,yc,t,y,'o' ) 


La gráfica de la curva continua es lineal por partes; por lo tanto, no parece muy suave. Mejórela, así: 


t1 E 0 000 Sd 
yc = polyval (coef, t1) 
plot (t1, yc, t, y, 'o') 


7. Esto y aquello 


Existen muchas otras características de MATLAB. Algunas de ellas las encontrará útiles; otras 
quizá nunca las use. Le sugerimos que explore y experimente. 

Para guardar una copia de su sesión, MATLAB tiene una posibilidad útil llamada diary. Utili- 
ce la instrucción 


diary probleml 


y MATLAB abre un archivo de disco donde almacena todas las instrucciones y los resultados (no 
las gráficas) de su sesión. Usted puede cerrar la instrucción diary tecleando: 


diary off 
y regresar al mismo archivo: 
diary on 


Después de salir de MATLAB, el archivo diary estará disponible. Es común usar un editor o proce- 
sador de palabras para limpiar el archivo diary (eliminando todos los errores que haya cometido, 
¡antes de que otras personas los vean!) y después imprimir el archivo para obtener una copia de las 
partes importantes de su sesión de trabajo; por ejemplo, los resultados numéricos clave. 

Salga de MATLAB con los comandos quit o exit. Se puede guardar el estado actual de su 
trabajo con la instrucción save. También se puede volver a cargar dicho estado con la instrucción 
load. 
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Iniciación a Mathcad 


Mathcad tiene una forma única de manejar las ecuaciones, los números, el texto y las gráficas. 
Funciona como un cuaderno de notas y un lápiz. La interfaz de pantalla es una hoja de cálculo en 
blanco en la que usted introduce ecuaciones, datos de gráficas o funciones, y anota las operaciones 
con texto. Cuando es posible, Mathcad usa símbolos matemáticos convencionales para representar 
los operadores matemáticos. Por lo tanto, usted puede descubrir que la interfaz de Mathcad es bas- 
tante natural y familiar. 

Mathcad puede resolver una amplia gama de problemas matemáticos, ya sea en forma numéri- 
ca o simbólica. Las capacidades simbólicas de Mathcad tienen relativamente poca aplicación en este 
texto, aunque se pueden usar para verificar nuestros resultados numéricos. Por lo tanto, no se cubri- 
rán en detalle en esta descripción general. Mathcad tiene un conjunto amplio de operadores y fun- 
ciones que dejan que usted realice mucho de los métodos numéricos que cubre este texto. También 
tiene un lenguaje de programación que le permite escribir sus propios procedimientos multilineales 
y subprogramas. La siguiente exposición presenta una breve descripción de las características de 
Mathcad que usted encontrará de máxima utilidad para este texto. 


FUNDAMENTOS DE MATHCAD 


En este texto, las aplicaciones exigirán que usted pueda crear sus propias hojas de cálculo. Para fa- 
cilitar sus esfuerzos, se revisan a continuación las principales características de la ventana de apli- 
cación Mathcad. 


El menú principal 


Mi File Edit View Insert Format Tools Symbolics Window Help 


Ésta es la puerta de entrada a Mathcad. También proporciona los comandos que manejan los detalles 
de edición y administración de las hojas de cálculo. Por ejemplo, haga clic en los menús File y Tools 
para ver algo de la funcionalidad disponible para usted. 


La barra estándar de herramientas 


O-> 4 Snhy¿BB/oco|"¿(90=|B0 0 (100% Y 


Deben aparecer automáticamente varias barras de herramienta debajo del menú Main. Como el 
nombre lo sugiere, la barra de herramientas Standard ofrece atajos para muchas de las tareas co- 
munes, desde abrir una hoja de cálculo y guardar el expediente hasta mostrar listas de funciones y 
unidades interconstruidas. 

Dependiendo de lo que usted esté haciendo en su hoja de cálculo, pueden aparecer desactivados 
en gris uno o más de estos botones. Si usted pasa el ratón sobre cada uno de los botones de la paleta, 
verá una descripción de la función del botón. 


La Pallette Calculator 


0 Els= [EE 3) as 
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Puede ser que la Pallette Math aparezca automáticamente en la parte superior de la pantalla. En 
caso contrario, sólo seleccione View, Toolbars, Math y aparecerá. A continuación se describen los 
botones y sus funciones: 


Calculadora EE Booleana 
Gráfica el Programación 
| E Vector y matriz Símbolo griego 
*2 Evaluación Palabra clave simbólica 


$2 


Cálculo diferencial e integral 


Haga clic en alguno de estos botones para hacer aparecer la pallette completa. Usted puede usar las 
paletas para insertar símbolos matemáticos y operaciones matemáticas directamente en su hoja de 
cálculo Mathcad. 


INTRODUCCIÓN DE TEXTO Y OPERACIONES MATEMÁTICAS 


Introducción de texto 


Para crear una región de texto, haga clic en un área en blanco de la pantalla para colocar el cursor con 
retícula roja y teclee dobles comillas ["]. Ahora usted puede teclear lo que quiera, como en un pro- 
cesador Word. Al crecer la región, aparece una caja negra alrededor del texto. La caja tiene “manijas” 
de redimensionamiento en las orillas derecha e inferior del rectángulo. Una vez que haya terminado, 
haga clic fuera de la región de texto para volver a la introducción de operaciones matemáticas. La caja 
negra de selección desaparece cuando usted ya no está trabajando en la región de texto. 


Operaciones matemáticas 


Tipo Vea en pantalla 


1+ 1 + a 


Haga clic en algún punto de la esquina superior izquierda de la hoja de cálculo y la retícula roja se debe 
mover al lugar donde usted hizo clic. Después de teclear el número 1 y el signo + verá una cajita negra 
delimitada por líneas de edición azules. En Mathcad, esta caja negra se llama “marcador de posición” 
(“placeholder”). Si usted sigue tecleando, lo siguiente que escriba aparecerá en el marcador de posición. 
Por ejemplo, teclee 2 en el marcador de posición y luego teclee el signo igual (=) para ver el resultado. 


1+2=3 


En seguida se da una lista de las operaciones aritméticas básicas, junto con sus teclas y los equiva- 
lentes de botones en la Pallette Calculator. 


Operación Tecla Pallette Ejemplo 


Suma + + 2+2=4 
Resta - - 2-2=0 
Multiplicación Pe x 2-2=4 
División / En Z=1 


Exponenciación A x" 22=4 


Apéndice C- Iniciación a Mathcad 


Observe que las operaciones aparecen en la hoja de cálculo Mathcad con la notación familiar: 
la multiplicación es un punto, la división una barra de fracción, los exponentes están en posición 
elevada, etc. Los cálculos se realizan internamente hasta 15 posiciones, pero usted puede mostrar 
menos posiciones en la respuesta. Para cambiar la forma predeterminada en la que se muestran los 
resultados numéricos y simbólicos en una hoja de cálculo, haga clic en un área en blanco de la hoja 
de cálculo. En seguida seleccione Result del menú Format para que aparezca la caja de diálogo 
Result Format y elija su configuración predeterminada. Asegúrese de marcar el botón rotulado “Ser 
as default” y haga clic en OK. Si sólo quiere cambiar la forma en la que se muestra un resultado en 
particular, haga clic en la ecuación y siga los mismos pasos. 

Aquí se dan algunos ejemplos adicionales que demuestran las características de Mathcad. 


idad e 2.3142353232 
100+33 


La mayoría de las funciones de ingeniería y de matemáticas están interconstruidas. 
3 
log(1347.2) - sen 6 - ») = 2.976 


Las funciones y los operadores de Mathcad manejan fácilmente números complejos. 


(2.3 + 4.71)" + e%= -148.613 — 47.498i 


FUNCIONES Y VARIABLES MATEMÁTICAS 


El símbolo de definición := se usa para definir una función o una variable en Mathcad. Por ejemplo, 
haga clic en una hoja de cálculo vacía para posicionar la retícula roja en un área en blanco y teclee: 


Teclee Verá en pantalla 


El símbolo de definición también se ubica en la selección Evaluation de la Pallette Math. Cuando 
usted cambia una función de definición o una variable, Mathcad recalcula inmediatamente los nue- 
vos valores que dependan de ella. Una vez que usted ha definido una función como f(x), puede 
verla de varias maneras; por ejemplo, 


f60 := 2 

Ahora puede insertar un valor numérico como el argumento de f(x) 
f£(10) = 100 

o definir una variable e insertarla como el argumento de f(x). 
x:=3 
f(x) =9 

Incluso puede definir otra función en términos de f(x): 
2(y) := f(y) +6 
269 = 15 


Observe que puede definir una función usando expresiones que construye a partir del teclado o de 
las paletas de operadores matemáticos. Usted también puede incluir cualquiera entre los cientos 
de funciones incorporadas de Mathcad. Para ver una lista de funciones incorporadas junto con bre- 
ves descripciones, seleccione Function en el menú Insert, o haga clic en el botón f(x). También 
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puede teclear el nombre de cualquier función interconstruida directamente en el teclado. Los siguien- 
tes son sólo unos pocos ejemplos que usan algunas de las funciones incorporadas de Mathcad: 
Trig and Logs 


In(26)=3.258  csc(45 -.deg) = 1.414 


Matrix Functions 
100 
identity(3) = o 1 o 
0 0 1 


Probability Distributions 
pnorm(2,0,1) = 0.977 


Variables de rango 


En Mathcad, usted verá que desea trabajar con un rango de valores para muchas aplicaciones; por 
ejemplo, para definir una serie de valores para graficar. Por lo tanto, Mathcad proporciona el operador 
de rango (..), que se puede introducir tecleando un punto y coma (;). El primer número y el último 
establecen los puntos finales de la variable de rango, y el segundo define el incremento. Por ejemplo: 


Teclear Verá en pantalla 


z:0,0.5;2 z:=0,0.5..2 


zZ= 


Cálculos y operaciones matriciales 


Para introducir una matriz, haga clic en el icono de matriz 3 x 3 en la Pallette Matrix (o elija Matrix 
en el menú Insert), elija el número de filas y columnas y luego llene los marcadores de lugar. Por 
ejemplo. 


4 5 1 
a| 5 0 12 
12 8 


Para calcular el inverso, 


Teclear Verá en pantalla 


0.135 0.12 0.163 


A-1= 0.074 —0.117 —0.184 
| | 
0.031. —0.132 —0.077 
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Mathcad tiene un amplio conjunto de comandos para realizar diversas operaciones con matrices. Por 
ejemplo, para encontrar un determinante, teclee la barra vertical (|) o use el botón en la Pallette 
Matrix. 


[A] = 326 


Unidades 


Mathcad puede también manejar unidades. Para ver las unidades interconstruidas, elija Unit en el 
menú Insert, o haga clic en el botón adecuado de la barra de herramientas. Para comenzar con un 
ejemplo sencillo, abra una nueva hoja de cálculo en Mathcad y teclee Mass :75kg[Enter]. Verá: 


Mass := 75 kg 


También podría haber tecleado Mass :75*kg[Enter], multiplicando la cantidad por la unidad. Aho- 
ra, introduzca g:9.8m/s”2 y deberá obtener 


. m 


Para ver cómo Mathcad administra las unidades con los cálculos, introduzca Mass*g= y el resulta- 
do se debe mostrar con unidades combinadas como 


Mass -g=735N 


Mathcad usa el sistema de unidades SI como predeterminado, pero usted puede cambiar esto 
en Tools, Worksheet Options, Unit System. Los sistemas alternos incluyen CGS, MKS y US. En 
vez de teclear la unidad, puede también insertarla de una lista. Ensaye lo siguiente: Teclee 
Temp:273.16* y luego haga clic en Insert, Unit. Seleccione Temperature en la caja superior y 
Kelvin(K) en la caja inferior y haga clic en OK. 


FUNCIÓN DE MÉTODOS NUMÉRICOS 


Mathcad tiene varias funciones especiales interconstruidas que realizan diversas operaciones numé- 
ricas de interés especial para los lectores de este libro. En el texto se describen en detalle ejemplos 
de desarrollo y aplicación de estas funciones. Aquí se da una breve lista de algunas de las más im- 
portantes sólo para darle una visión general de las capacidades. Su uso se ilustra en las secciones 
correspondientes de este libro. 


Nombre de la función Uso 


root Resuelve f(x) = 0 

polyroots Encuentra todas las raíces de un polinomio 

find Resuelve un sistema de ecuaciones algebraicas no lineales 

minerr Devuelve una solución de error mínimo de un sistema de ecuaciones 

Isolve Resuelve un sistema de ecuaciones algebraicas lineales 

linterp Interpolación lineal 

cspline Interpolación cúbica de trazador (spline) 

regress Regresión polinómica 

genfit Regresión general no lineal 

fft Transformada de Fourier 

ifft Transformada de Fourier inversa 

rkfixed Resuelve un sistema de ecuaciones diferenciales usando un método de Runge-Kutta 
de cuarto orden de tamaño de paso fijo 

rkadapt Resuelve un sistema de ecuaciones diferenciales usando un método de Runge-Kutta 
de cuarto orden de tamaño de paso variable 

sbval Resuelve un problema de valor de frontera de dos puntos 

eigenvals Encuentra valores propios 

eigenvecs Encuentra vectores propios 


relax Resuelve ecuación de Poisson para un dominio cuadrado 
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PROCEDIMIENTOS Y SUBPROGRAMAS DE LÍNEAS MÚLTIPLES 


La Pallette Programming de Mathcad proporciona la capacidad para procedimientos o subprogra- 
mas de líneas múltiples con estructuras estándar de control como ciclos FOR y WHILE, ramificación, 
recursividad y más. Se pueden integrar subprogramas con las hojas de cálculo de Mathcad y pueden 
Operar en escalares, vectores, matrices e incluso matrices de matrices. 


CREACIÓN DE GRÁFICAS 


Las capacidades de Mathcad para gráficas son especialmente importantes para el trabajo de inge- 
niería. El primer tipo de gráfica de la que se debe saber es el QuickPlot. Comience con una nueva 
hoja de cálculo e introduzca la siguiente fórmula. Deje seleccionada la fórmula 


e? -(2-x)-1I 


En el menú, seleccione Insert, Graph, X-Y Plot. Haga clic lejos de la gráfica y debe ver un Quick- 
Plot automático. 


Esta gráfica se puede ahora ajustar como se desee. Por ejemplo, haga clic en la gráfica para selec- 
cionarla y cambie los límites de xa O a 1. Esto debe aparecer como 


70 02 04 06 08 

0 Xx 1 

Luego haga clic lejos de la gráfica y el eje y se reescalará automáticamente. Haga doble clic en la 
gráfica y debe aparecer la caja de diálogo Formatting Currently Selected X-Y Plot. Revise las 


cajas para encontrar los ejes de coordenadas X y Y y haga clic en OK. Haga clic lejos de la gráfica 
y debe tener ahora 


70 02 04 06 083 


Xx 
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Mathcad grafica un punto para cada valor de la variable x del rango. Esta variable se creó auto- 
máticamente en este caso. Los puntos x-y se unen mediante segmentos cortos de línea recta. Usted 
puede crear su propia variable del rango para el eje x. 

En vez de usar una fórmula para el eje y, usted puede usar una función. Para ilustrar esto, intro- 
duzca la siguiente definición de función arriba de su gráfica 


y cambie el eje y de la fórmula a f(x). Usted debe obtener la misma gráfica, pero ahora es en térmi- 
nos de la función f(x) que se usó para el eje x. Pruebe otro ejemplo debajo de su gráfica actual. Haga 
las siguientes definiciones: 


N := 100 0 :=0, 


x(0) := cos(0) y(0) := sin(0) 


Inserte una gráfica en blanco oprimiendo la tecla E (shift-2). Introduzca y (0) en el marcador de 
lugar del eje y, y x (0) en el marcador de lugar del eje x, y haga clic lejos de la gráfica. Esto debe dar 
la gráfica de una circunferencia. 


x(0) 


También es posible graficar los elementos de un vector. Cree el siguiente vector de probabilidades 
binomiales: 


i:=0.. 10 
pi :=0.41.0,600 — D 


e inserte un gráfico con i en el eje x y p, en el eje y (puede usar la tecla [ para el subíndice). Su 
gráfica debe verse como 


2107? 


é6x107* 


D0 02.4 6 3 10 


Por supuesto, usted puede graficar un vector también contra otro, siempre y cuando ambos tengan 
el mismo número de elementos. Los vectores podrían contener datos en vez de una fórmula mate- 
mática. 
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Hay muchas configuraciones de ejes que se pueden ajustar haciendo doble clic en la gráfica. 
Éstas se explican por sí mismas en gran medida, y usted se puede familiarizar con ellas por la 
práctica. 

Hay muchos otros estilos de gráficas que se pueden generar por Mathcad. Éstos incluyen gráficas 
polares, de superficie, de contorno, de barra 3D, dispersa, de campo vectorial y animaciones gráficas. 


MATEMÁTICAS SIMBÓLICAS 


Una característica intrigante y valiosa de Mathcad es su capacidad de llevar a cabo manipulaciones 
de matemática simbólica. Las capacidades simbólicas incluyen 


+ Manipulaciones algebraicas. 
+ Cálculo: diferenciación e integración. 
+ Resolución de ecuaciones algebraicas y sistemas de tales ecuaciones. 


y más características avanzadas 


+ Transformadas simbólicas de Fourier, de Laplace y z. 
* Optimización simbólica. 


En seguida se reseña el primer grupo. 
Se comenzará con un sencillo ejemplo de álgebra simbólica. Introduzca la expresión 


EF2 ts 1) (4) 


Expanda la línea horizontal de edición para que abarque toda la expresión y luego seleccione Expand 
del menú Symbolics. Usted debe ver 


+5.x24+2.x-8 


Ahora, introduzca el polinomio x* + 31? + 3x + 1 y siga el mismo procedimiento, pero elija Factor 
del menú Symbolics. Usted debe tener 


x2+3-.x2+3-x+1 
(x+ 1 


Otra forma de llevar a cabo los comandos simbólicos es mediante teclas. Introduzca la siguiente 
expresión: 


Luego oprima la combinación de teclas Ctrl-Shift-. y teclee simpl1if y en el marcador de lugar que 
aparece. Usted debe obtener 


x?-3-x-4 


+2+.x-—5 simplify >3-x-— 4 
x—4 


Éste es un estilo diferente de evaluación simbólica que tiene la palabra clave retenida y muestra el 
resultado a la derecha. Usted ha visto el uso de tres importantes operadores simbólicos: 


* expand Expandir todas las potencias y productos de las sumas. 
* factor Factor dentro de un producto de funciones más simples. 
* simplify Simplifica realizando aritmética, cancelando factores comunes, usando identidades 


y simplificando potencias. 


Las características algebraicas adicionales incluyen expansión a una serie, expansión de fracciones 
parciales y extracción de coeficientes de un polinomio en un vector. 
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Ahora se va a experimentar con diferenciación simple. Introduzca la expresión 


y deje seleccionada la T (o haga clic en ella para seleccionarla). Luego seleccione Variable y Diffe- 
rentiate del menú Symbolics. Usted debe tener el resultado 
-E 


R.T 
e 


Otra forma de hacer esto es usar el operador de diferenciación de la barra de herramientas Calculus. 
Introduzca la siguiente expresión 


— 
y luego haga clic en el botón en la barra de herramientas Evaluation. (También puede oprimir 
Ctrl-.) El resultado debe ser 


2 
e sinco) > 2 six) — ina + dx cosí(x) 
dx 


Las integrales simbólicas se pueden determinar en forma ya sea definida o indefinida. Para una 

integral indefinida, comience tecleando Ctrl-i o haga clic en el botón 4] en la barra de herra- 
li 

mientas Calculus. Luego introduzca la función deseada y la diferencial, seguidas del botón 

para producir el siguiente resultado: 


| a “dii=i ” 


Mathcad puede también calcular límites simbólicamente. Los botones adecuados están en la barra 
de herramientas Calculus. 


PARA APRENDER MÁS ACERCA DE MATHCAD 


En esta breve introducción, se ha cubierto sólo lo básico de Mathcad. Hay disponible asistencia 
adicional en el paquete de software Mathcad en diversas formas. 


ToolTips 


Deje flotar el cursor del ratón sobre un botón de paleta o barra de herramientas durante unos pocos 
segundos. Verá una nota explicativa cerca del botón. Vea también en la línea de mensaje en la parte 
inferior de la ventana de aplicación Mathcad para encontrar pistas y atajos útiles. 
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Centro de recursos y QuickSheets 


Para ayudarle a comenzar rápido y mantenerle aprendiendo, Mathcad viene completo con Quick- 
Sheets. Éstas proporcionan atajos matemáticos para análisis de uso frecuente —desde graficar una 
función hasta resolver ecuaciones simultáneas y realizar análisis de varianza—. Hay numerosas 
QuickSheets. Para abrir la sección de QuickSheets, elija QuickSheets de la opción Help en el menú 
Main. 


Ayuda en línea 


Online Help proporciona instrucciones detalladas, paso a paso, para usar todas las características 
de Mathcad. Siempre hay ayuda disponible en cualquier momento simplemente acudiendo al botón 
Help en el menú Main. Allí encontrará varios vínculos, incluido el sitio de red Mathcad y Mathcad 
Training. 
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Corrector, 561 
Corrientes de Kirchhof, regla para las, 
257, 258 
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de la desviación estándar, 349 
suma inexplicable de los, 362 
Cuadratura 
adaptiva, 500 
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de potencias, 367 
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del crecimiento, 367 
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del parámetro, 632 
error estándar de la, 361 
Estimación del error, 82 
en el método de Newton-Raphson, 
118 
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Fórmulas cerradas, 507 
de Adams de segundo orden, 600 
de Newton-Cotes, 473, 542 
Fortran 90, 37 
Fourier 
análisis de, 442 
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trascendentes, 93 
trigonométricas, 93, 410 


G 
Gases 
de invernadero, 162 
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fórmula de, 385 
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matricial, 304 
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de punto fijo, 243 
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L 
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Fourier, 516, 611, 711 
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voltaje de Kirchhoff, 638 
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de cifras significativas, 46 
Línea(s), 692 
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balance de, 253 
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producto de dos, 185 
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suma de dos, 184 
Matriz, 183 
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Matriz diagonal, 184, 621 
inferior, 220 
principal de la, 184 
Matriz triangular 
inferior, 184 
superior, 184 
Matriz-uniforme, 232 
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de almacenamiento en una columna 
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desventajas del, 380 
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